Antonio García Megía

Angarmegia: Ciencia, Cultura y Educación http://angarmegia.com angarmegia@angarmegia.com

LA PONDERACIÓN DE LA POSICIÓN Y LOS COEFICIENTES DE DISPONIBILIDAD LÉXICA. CONVENIENCIA DE ENSAYAR OTROS PROCEDIMIENTOS DE CÁLCULO
EL MODELO PROBABILÍSTICO DESARROLLADO POR ANTONIO GARCÍA MEGÍA
Tercera Parte

OTRO MODO DE CALCULAR LOS COEFICIENTES: UNA FÓRMULA ALTERNATIVA

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Para alcanzar el nuevo protocolo paradigmático de números y operaciones que aquí se propone, capaz de representar suficientemente el poder de las relaciones que condicionan la producción lingüística y derivar en una fórmula que genere un indicador más fiable y objetivo de los coeficientes de disponibilidad léxica, se tiene presente que: 1. El carácter matemático de la construcción impone la sumisión absoluta a las reglas que organizan el dominio numérico que aporta generosamente las herramientas, pero establece claramente los límites de su uso. 2. La actuación sobre una muestra representativa conlleva un error sistemático que es preciso aceptar y medir. 3. Los datos no resultan de la observación de un hecho espontáneo, sino de una situación provocada en laboratorio, lo cual fuerza a discriminar con precisión qué elementos significativos lo son de acuerdo con su presencia efectiva en el acto de la comunicación, y cuáles nacen de la subjetividad del investigador o son inherentes al método. Se acude al ámbito de las probabilidades, pero lejos de la concepción más tradicional y al uso que la entiende al modo y manera de un juego de azar. No se trata de extraer una bola roja del interior de una urna, ni de predecir la posibilidad de elegir el as de corazones entre el conjunto de naipes que constituyen la baraja francesa. Se contemplan actos volitivos, cargados de humanidad y condicionados por la cultura, los intereses, los sentimientos, las sensaciones y hasta la capacidad fisiológica e intelectual de cada sujeto cuyo comportamiento se analiza. Por eso se busca siempre el apoyo de postulados y teoremas extraídos del campo de la probabilidad a posteriori que oferta instrumentos más sensibles a esta realidad. Existen dos enfoques a la hora de afrontar problemas de probabilidad. El modo más clásico de interpretar las manifestaciones del azar se denomina probabilidad a priori. Este planteamiento es capaz de aventurar una hipótesis que establece la eventualidad de ocurrencia

4

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

de un suceso aleatorio antes de que se produzca, es decir, a priori. En su forma más simple prevé, y cuenta, todas las variables posibles del hecho y las relaciona con aquellas que son favorables, esto es, las que cumplen la condición que se ha establecido o se pretende medir. Sus predicciones son del tipo: la probabilidad de ocurrencia del suceso “s” es de “p” veces favorable por cada “n” intentos [RÍUS; BARÓN; SÁNCHEZ y PARRAS. 1995]. Se cuantifica a partir de la ecuación que, a principios del siglo XIX [LAPLACE, P. S. 1812; 1825], enuncia Pierre Simón de Laplace:

ρ (A )

p (sucesos favorables de A) n (sucesos posibles )

En el lanzamiento de un dado, la probabilidad del suceso “A = 1" es 1/6, supuesto que tenga seis caras (casos posibles) y sólo una cumpla la condición requerida, “es 1" (casos favorables). El grado de confianza del vaticinio se establece en proporción directa con el número de tentativas o repeticiones. Se cumple sólo para grandes valores de “n”. El segundo punto de vista contempla la probabilidad desde una óptica más frecuentista que no sabe previamente de casos posibles ni favorables. En la probabilidad a posteriori la eventualidad teórica de ocurrencia de un fenómeno queda matizada por la información que aportan experimentos ya concluidos. En el ejemplo anterior se partiría del desconocimiento del número de caras que tiene el dado y de cuántas de ellas cumplen la condición “es igual a 1". La medida de la posibilidad de ocurrencia del suceso se deduce sólo a partir de lo acontecido en experiencias terminadas, por lo que, a medida que éstas se incrementan, se ajusta el guarismo que la concreta. La probabilidad a posteriori acepta como contingencia de un suceso su frecuencia relativa después de observado un número estadísticamente suficiente de veces
SÁNCHEZ y PARRAS. 1995]. [RÍUS; BARÓN;

Sus expresiones suelen ser del tipo: el suceso aleatorio “s” ha

ocurrido “f” veces en “n” intentos. Las conclusiones son fácilmente extrapolables a situaciones producidas en condiciones parecidas. El cálculo, en este caso, responde a la fórmula:

5

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

ρ(A)

f (frecuencia de aparición de A) n (total de casos observados)

Si se admite que la posición de un vocablo en una lista es el indicador más cualificado para subrayar su tendencia a aparecer en un contexto temático, la palabra más disponible será, con certeza, aquella que encabece la relación; a continuación se situará la segunda, luego la tercera... En lógica consecuencia, el valor significativo del lugar de aparición decrece a medida que avanza el listado. Este principio no resta relevancia a la frecuencia, sino que la pondera de acuerdo con la importancia que otorga al orden de las actualizaciones. La frecuencia expresa de manera incuestionable la cantidad de individuos que conocen una palabra, la posición, en cambio, la fuerza de seducción que ejerce, en cada caso, el tema. El índice de disponibilidad debe combinar de forma adecuada ambas referencias. La diferencia del método tradicional de cálculo del coeficiente de disponibilidad con el que aquí se oferta, estriba en que no estima el elemento posición a partir de un patrón de variación continuo, uniforme y permanente, dependiente de constantes moderadoras de la frecuencia, en la línea de la tasa de sustitución, sino como respuesta única, personal, y, posiblemente, irrepetible, condicionada por la actuación sobre el hablante de estímulos y elementos internos, externos y temporales, como el funcionamiento de la memoria, los mecanismos de asociación verbal, la estación del año... En consecuencia con el criterio expuesto, la primera palabra es la única que surge como respuesta inmediata a la incitación inicial. Las siguientes derivan de situaciones cada vez más complejas y condicionadas. La motivación que arranca la cadena lingüística es sucesivamente modificada, y enriquecida, por las sugerencias y connotaciones que añaden, en conjunto o de forma aislada, todos los términos que se han actualizado. Cada aportación es consecuencia del papel activo que desempeña, por sí misma, dentro del campo semántico en que se produce, pero también de su relación con el mundo personal de significación afectiva que suman todas las precedentes a la situación comunicativa. Se podrán compartir, o no, posturas conductistas para explicar el fenómeno lingüístico en su integridad, pero no parece cuestionable que los resortes asociativos influyen en los actos de habla y tienen una alta repercusión en el cálculo de la disponibilidad, especialmente en el ámbito del método. El repaso de los listados prueba que, generalmente, a “blanco” sigue “negro” y a “perro”, “gato”. También deja patente que triadas como “cuchillo”, “cuchara” y

6

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

“tenedor”, se relacionan con tal fuerza que constituyen un todo casi indivisible. La evidente presencia del fenómeno de la asociación verbal no contradice, sino que refuerza, la atribución de valores decrecientes a la secuencia posición. Convenido esto, el problema de cuantificar la posición pasa, ante todo, por decidir el modelo matemático a partir del cual se articulen los cálculos. Los habituales interpretan la relación peso-posición como una función:
y f(x)

donde:

y es peso de la posición x es posición f es constante.

El peso de la posición, variable y, responde siempre a f, operación o conjunto de operaciones que se realizan a partir de la posición, variable x. En este caso se encuentran la tasa de sustitución, “la razón entre una variación en la frecuencia relativa en la primera posición y el cambio necesario en la siguiente posición para compensar la variación” [BUTRÓN, G. 1987:39], o el coeficiente de dispersión. Ambos se construyen como funciones exponenciales. La primera propone
Tasa de sustitución λi
1

donde

λ es un valor constante i es posición

que claramente responde a la función
x 1

y

λ

donde

y es peso atribuido a la posición. x es posición.

7

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Lo mismo ocurre con el coeficiente de dispersión:
c (i 1) (n 1)

Coeficiente

de dispersión

e

donde:

e es constante base de los logaritmos neperianos. c es valor constante. n es longitud máxima alcanzada. i es posición.

que equivale a la función

y e

c

(x 1) (n 1)

donde

y es peso atribuido a la posición. x es posición. n es longitud máxima alcanzada.

Lo novedoso de este coeficiente reside en la introducción de “n”. La máxima longitud de lista alcanzada, “n”, es el único valor que procede de la muestra que se trabaja, el resto de los operadores son constantes subjetivas escogidas para cumplir los postulados teóricos sobre los que se asienta la investigación. El modelo que se desarrolla a continuación elude las constantes numéricas fijadas a priori y obtiene todos sus operadores de las relaciones y números que resultan del recuento y la observación de los datos. En un primer diseño se ponderó el valor de la posición en función del total de términos mencionados en cada lista con la intención de promediar resultados. Esta interpretación supuso trasladar la estimación de la disponibilidad léxica a un estadio muy personalizado, ya que evalúa la situación de cada individuo de forma separada y relega a un segundo plano los datos marginales aportados por las tablas de frecuencia. No opera con la frecuencia relativa de las palabras en cada posición, sino con el tamaño de los listados en los cuales aparece. Su origen hay que buscarlo en un sencillo razonamiento: no parece lógico otorgar igual significación a la primera mención que evoca un individuo que enumera hasta treinta
8

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

palabras dentro de un tiempo establecido, que al término inicial de otro informante que actualiza sólo diez. La atracción léxica que mueve a elegir una opción entre varias posibles, tanto si es consecuencia de un acto volitivo más o menos condicionado por razones lingüísticas y psicológicas, como si es el resultado de una mera situación de azar, debe ser más grande cuando se dispone de treinta posibilidades que cuando se cuenta sólo con diez. De acuerdo con esa reflexión, se procede a calcular la contingencia de una palabra para aparecer en cada posición de un listado según el número total de términos que éste recoge. Para su cuantificación se acude a la fórmula de Laplace
ρ Casos favorables Casos posibles

Considerando que dos palabras no pueden ocupar el mismo espacio en una lista, el número de casos favorables en cada posición siempre es 1. El denominador de la fracción alcanza su valor máximo, el total de términos actualizados por el informante, en la primera mención. A partir de aquí decrece, unidad a unidad, según progresa la relación al no admitirse la repetición. Un ejemplo para aclarar la evolución: sea una lista de cinco vocablos. La primera palabra actualizada tendrá una probabilidad de aparición de 1/5, es decir, 0.20. La segunda contempla sólo cuatro casos posibles, ya que el término mencionado no puede volver a aparecer; su probabilidad vendrá dada por el cociente 1/4, o sea, 0.25. La tercera resultará de 1/3... El algoritmo aplicado es
1 ( L 1)

Disponibilidad de la palabra en cada lista de

T

donde:

L es posición T es total de palabras mencionadas en la lista

El índice para el conjunto de la población pasará por sumar sus disponibilidades parciales y promediar el resultado atendiendo al número de encuestados. Es decir

9

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Disponibilidad

palabra

1 j N T (L 1 ) N

j 1

donde:

L es posición T es total de palabras mencionadas en la lista N es número de informantes encuestados j es individuo Tabla 1

La Tabla 1 presenta la evolución de los índices asignados en listados con longitudes comprendidas entre 1 y 15 palabras. De su observación se deduce: 1. Los valores atribuidos a cada posición constituyen una sucesión de números reales cuyo límite es 1. El puntaje de la primera posición varía en razón inversa a la longitud de la lista y genera otra sucesión cuyo límite es 0. A pesar de partir de un principio teórico diferente, los números de dicha sucesión responden a una función similar a la de otros métodos de cálculo:
y 1 x 1

10

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

2. El hecho de que los cocientes se incrementen de forma constante hasta igualar en 1 la última posición de cada lista, se debe a que la última mención se convierte en un suceso seguro por no disponer el sujeto de alternativa a su actualización. 3. El cálculo atribuye los indicadores más altos a las últimas posiciones y los más bajos a las primeras, justo lo contrario de lo que se viene defendiendo. La causa es simple, a medida que se avanza en la relación los divisores son menores, manteniéndose el dividendo. Véanse las gráficas:
Gráfico 1

Gráfico 2

Los dos gráficos anteriores aclaran esas cuestiones. El Gráfico 1 recoge los pesos que corresponderían a las posiciones en listados de once, doce, trace, catorce y quince términos.
11

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

El Gráfico 2, por su parte, dibuja la evolución de los valores calculados para la primera posición de acuerdo con distintas longitudes de lista. La constatación de las incongruencias enumeradas en los datos que resultan con los planteamientos teóricos de partida, aconseja cambiar la perspectiva de cálculo sin abandonar la orientación esencial de la línea de metodológica. La hipótesis explotada ahora va a ser la siguiente:
Si se acepta que la elección de cada palabra responde a un acto volitivo mediante el cual el hablante selecciona un término entre aquellos que conoce y considera adecuados al contexto, puede resultar apropiado para estimar su disponibilidad igualar la fuerza de esta elección a la que se opone a su aparición, supuesto un suceso enteramente aleatorio.

La fuerza de oposición a la que se hace referencia puede identificarse con el concepto de probabilidad complementaria. La probabilidad complementaria
[AMÓN, J. 1982:42-43]

se

deriva del tercer axioma del cálculo de probabilidades, “la probabilidad de unión de dos sucesos, „S1‟ y „S2‟, mutuamente exclusivos, es la suma de sus probabilidades”:
] [ Axioma 3 P(S1 S2) P( S1) P(S2) Si S1 S2 φ

A partir de [Axioma 3] se deduce que

Probabilidad Complementaria Suceso (A)

1

ρ Suceso (A)

donde

 suceso (A) es probabilidad del suceso (A)

Si la disponibilidad de la palabra en la lista se había contemplado como la aplicación del teorema de la propiedad complementaría daría

Disponibilidad de la palabra en cada lista

1 T (L 1)

12

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

donde:

L es posición T total de palabras mencionadas en la lista

Sin embargo, del nuevo enfoque tampoco se siguen resultados satisfactorios. Se progresa en algún aspecto, pero hay retroceso en otros. Véase la Tabla 2 que contiene los coeficientes calculados por este procedimiento para listas de hasta quince términos.

Tabla 1

Su lectura evidencia que:    Se obtienen puntajes decrecientes desde la primera a la última posición. Los coeficientes atribuidos a la posición 1, se incrementan de acuerdo con el número de palabras que conoce el informante. Se igualan en 0 todas las longitudes en la última posición. Se avanza en las situaciones 1 y 2, que se ajustan a los presupuestos de la investigación, pero parece improcedente asumir el 0 como coeficiente atribuible a la última palabra de la relación porque significa, de hecho, una pérdida de información criticada en otros métodos. Los gráficos que siguen ayudan a visualizar lo que se afirma.

13

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Gráfico 3

Gráfico 4

14

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com Gráfico 5

El Gráfico 3 demuestra que: 1. La función descrita es idéntica a la recogida el Gráfico 4, aunque ha invertido su orientación. 2. La última posición merece la puntuación 0 y la primera muestra una tendencia hacia el 1, que, sin embargo, nunca va a alcanzar. Los valores que corresponden a la primera posición de cada listado se pueden observar en el Gráfico 4. Por último, si, como hace el Gráfico 5, se trazan sobre los mismos ejes los valores alcanzados por las primeras menciones con uno y otro procedimiento, se obtiene una figura simétrica, absolutamente previsible, que refuerza el paralelismo destacado. El análisis que antecede demanda un cambio radical de orientación en la vía de investigación descrita, ya que no parece conducir hasta los objetivos perseguidos. Las incongruencias en los resultados y en el método de cálculo que, en la práctica, responde al mismo modelo de función que se desea sustituir, con la importante diferencia de no contener constantes subjetivas, así lo aconsejan. Obsérvese, en la Tabla 2, la secuencia de los números que ponderan las posiciones y que es consecuente con el paradigma matemático construido. La probabilidad de ocurrencia de la tercera posición, por ejemplo, en una lista de diez términos, es la misma que se calcula para la segunda posición de una relación de nueve, lo cual no guarda la suficiente coherencia con la realidad que retrata. Si el acto del habla deriva de leyes no radicalmente estrictas y está

15

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

sometido, además, a influjos puntuales del entorno espacio-temporal y de condicionantes psicológicos personales, no puede responder a un patrón tan regular. Para reconducir la situación, se mira de nuevo hacia el dato longitud de lista. Ya se justificó su incorporación a la fórmula por el reconocimiento de una mayor disponibilidad para las primeras menciones de los listados más largos, lo que derivó en un estudio individualizado de las encuestas para promediar luego resultados. Pero, actuando de ese modo, no se evalúa realmente la incidencia del léxico conocido en la disponibilidad. Lo verdaderamente importante es cuantificar la significación de ese detalle en el conjunto de la muestra. Sólo conocer cuántos encuestados logran alcanzar una determinada posición dará cuenta de su exacto valor. Para trabajar esta vía se retoma clásica tabla de frecuencias y se acude al concepto de probabilidad condicional. Se denomina probabilidad condicional o condicionada de “A” supuesto “B”, a la probabilidad de que coincidan ambas ocurrencias en el suceso, o lo que es igual, la probabilidad de que un segundo evento “A” se presente, si un primer evento “B” ya ha sucedido [QUESADA PALOMA, ISIDORO MARTÍN y LÓPEZ MARTÍN. 1982:137]. Se obtiene de

Probabilidad (B/A)

Probabilidad (A B) Probabilidad A

La probabilidad condicional referida al objeto de este estudio podría expresarse como la medida de probabilidad que tiene una palabra, conocida en una comunidad, para ser actualizada por uno de sus miembros en una posición determinada de la lista. Este planteamiento introduce elementos no tomados en cuenta hasta ahora, el número de vocablos diferentes recogidos en la muestra, y la posibilidad de contemplar la información disponible desde una óptica bayesiana. El Teorema de Bayes, es un enunciado deductivo que define y relaciona tres conceptos, la probabilidad a priori, la verosimilitud y la probabilidad a posteriori, concluyendo en un algoritmo matemático conocido como fórmula de Bayes1, [BAYES, T. 1908].
1

Thomas Bayes, pastor de la iglesia presbiteriana, fue el primero en utilizar inductivamente la probabilidad. Llegó a ser miembro de la Royal Society en 1742 a pesar de no haber publicado, en esa fecha, ningún trabajo matemático. Después de su muerte su amigo Richard Price envió a dicha sociedad un trabajo que encontró entre sus documentos privados para su publicación. Es el origen de la probabilidad denominada bayesiana. Se puede profundizar esta rama de la Estadística en BERNARDO J.M. [1996; 2000], DALE, A. [1991], NIETO DE ALBA, U. [1978], PHILIPS, L. [1993]... 16

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Su objeto es ajustar al máximo el calculo de la posibilidad de ocurrencia de un suceso, probabilidad a posteriori, partiendo de su probabilidad teórica, o probabilidad a priori, y conocidos los resultados habidos en experiencias anteriores similares, verosimilitud. Quesada Paloma [QUESADA, ISIDORO y LÓPEZ. 1982:141-142] la transcribe así:
Probabilidad ( Aj / B) Prob. (Aj) n i 1 Prob. (Ai) Prob. ( B / Aj) Prob. ( B / Ai)

Un ejemplo sencillo puede aclarar el razonamiento y el método de cálculo:
Se pretende estimar la probabilidad para que un alumno escoja una expresión entre cuatro propuestas (“a”, “b”, “c”, “d”) como la más adecuada para expresar un sentimiento. En experiencias anteriores dos alumnos de ocho optaron por la frase “a”, tres de nueve por “b”, cuatro de doce por “c” y solo uno de diez eligió “d”.

En el problema, supuesto que las expresiones tengan la misma posibilidad de ser seleccionadas, la probabilidad a priori es, en todos los casos, 1/4. Las experiencias anteriores atribuyen unas verosimilitudes de 2/8 para “a”, 3/9 para “b”, 4/12 para “c” y 1/10 para “d”. La probabilidad final se consigue mediante una tabla de cálculo similar a la Tabla 3.
1982:53-60]. [AMÓN, J.

El procedimiento otorga, gracias a la información procedente de experiencias

acumuladas (verosimilitudes), un abanico de posibilidades que oscila entre tres centésimas y setenta y seis centésimas. Nótese que la presunción primera, a priori, esperaba un valor, igual para todas las opciones, estimado en veinticinco centésimas.
Tabla 3 Prob. a priori a b c d 1/4 1/4 1/4 1/4 Verosímil. 2/8 3/9 4/12 1/10 Prob. A priori * Veros. 2/32 = 0.625 3/36 = 0.083 4/48 = 0.083 1/40 = 0.025 Suma = 0.816 Prob. A post. 0.625/0.816 = 0.766 0.083/0.816 = 0.102 0.083/0.816 = 0.102 0.025/0.816 = 0.030 Suma = 1.0002

2

Nótese que la suma de todas las probabilidades a posteriori es igual a 1 como establece el axioma 1 de la probabilidad. 17

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Buscar por un método bayesiano los coeficientes de disponibilidad léxica requiere contabilizar el total de términos distintos a disposición de la muestra. Esta necesidad nace del cociente que calcula la probabilidad a priori de cada palabra conocida en la comunidad de habla para ser elegida por uno de sus miembros, supuesto que: 1. El fenómeno sea puramente aleatorio. 2. Todos los informantes tengan posibilidad de acceder al uso de cualquier término conocido por el colectivo al que pertenecen. Admitido esto, la probabilidad a priori de hallaría así:

Prob . a priori

1
palabra a , b , c . ..

n

p

donde

np es número de palabras diferentes aparecidas.

La matización de lo probable y contingente, probabilidad a priori, mediante lo intencionado y facultativo, verosimilitud, resultará del recuento de las frecuencias relativas de cada término. Es decir:
Verosimilitudpalabra m Fm T

donde

T es número total de palabras actualizadas en el conjunto de la muestra. Fm es frecuencia final de cualquier palabra: m.

Véase otro ejemplo recogido en la Tabla 4. Se supone un colectivo constituido por 56 informantes que alcanzan una longitud de lista máxima (rango) de 10 menciones y conocen hasta 11 términos diferentes (“a”, “b”, “c”,..., “k”) cuyas frecuencias aparecen en la columna del margen derecho.

18

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com Tabla 2

La probabilidad teórica, a priori, de elección de cada una de las palabras, dado que np es igual a 11, será:
Probabilidadpriori 1 11 0.091

La probabilidad efectiva, verosimilitud, vendrá del cociente establecido entre cada frecuencia y el total de menciones recogidas. En este caso el denominador T toma el valor de 466. Por lo tanto:
Vesosimilitudpalabra Frecuenciapalabra 466

La probabilidad a posterior se alcanza en la Tabla 5.
Tabla 5

19

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

La columna producto recoge el resultado de:
Frecuencia T

Prob . a priori

palabra m

Vesosimilitud

1
palabra m

palabra m

n

p

donde

np es número de palabras diferentes aparecidas. T es número total de palabras actualizadas en el conjunto de la muestra

En el supuesto:
Productom 1 Frecuenciapalabra m 11 466 Frecuenciapalabra m 5126

La última columna de la tabla de cálculo3 , que concluye la tendencia de aparición de cada entrada ponderada desde el punto de vista de la probabilidad (dentro del intervalo comprendido entre 0 y 1), responde a la fórmula:
Fm Prob . a posteriori np T
palabra
m

m n

Fm

m 1 np T

donde

np es número de palabras diferentes aparecidas. T es número total de palabras actualizadas en el conjunto de la muestra Fm es frecuencia final de la palabra.

Si se extrae el factor común y se simplifica, queda
Fm Prob. a posteriori palabra np T
m

Fm T Fm

1

m n

( np T ) m 1

donde
3

T es número total de palabras actualizadas en el conjunto de la muestra

Nótese que la probabilidad a posteriori obtenida coincide con la verosimilitud, lo cual facilita notablemente el trabajo futuro. Esto era esperable porque el supuesto contempla la misma probabilidad teórica para cada entrada. 20

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com Fm es frecuencia final de la palabra.

Hasta el momento no se ha tomado en consideración el elemento posición. Para hacerlo conviene recordar que se quiere: 1. Buscar, dentro del sistema, una alternativa a los modelos exponenciales que usan constantes sugeridas de acuerdo con un entramado de condiciones ajenas a los datos, por otro que opere “con”, y “a partir de”, la información generada dentro de la propia muestra. 2. Rechazar la puntuación uniforme que define igual peso a la misma posición. No parece coherente premiar con significación semejante una “cuarta posición” aparecida dentro de un colectivo que raramente alcanza el lugar doce, y otra “cuarta posición” producida en una comunidad donde habitualmente se llega al puesto veinticinco. En armonía con esa doble perspectiva, aquí se propone ponderar la posición con dos variables: el número de informantes que la logran y el total de menciones generadas hasta cubrirla. Para desarrollar esta idea considérese de nuevo de la tabla de frecuencias Tabla 6. La última fila recoge el total de encuestados que completan las posiciones: todos, es decir, cincuenta y seis, cumplimentan la primera, cincuenta y cinco la segunda,... y sólo treinta y seis llegan a la décima. Tabla 6

Luego, se puede afirmar que:

21

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Cincuenta y seis informantes, de cincuenta y seis posibles, alcanzan la “posición uno”; cincuenta y cinco personas de las cincuenta y seis encuestadas, la “posición dos”; cincuenta y dos de cincuenta y seis, la “posición tres”...

Las primeras cincuenta y seis palabras emitidas por los informantes, ocupan necesariamente la “posición uno”; las siguientes cincuenta y cinco palabras, de las ciento once emitidas, la “posición dos”; cincuenta y dos de ciento sesenta y seis actualizaciones, “la posición tres”... Hay una primera fila adicional, “términos hasta la posición”, que cuenta las menciones

habidas hasta cubrir cada referencia (56 términos recoge la “posición 1”, 111 se computan hasta completar la “posición 2”, 163 integran la “posición 3”...). Con su auxilio se estima la “probabilidad de la columna”: cincuenta y seis de cincuenta y seis (56/56); cincuenta y cinco de ciento once (55/111); cincuenta y dos de ciento sesenta y tres (52/163)... De un cociente similar resulta la “probabilidad de la palabra en la columna”. Esto es, una palabra de cincuenta y seis posibles (1/56); una palabra de ciento once posibles (1/111); una palabra de ciento sesenta y tres posibles (1/163)... Se antepone, además, una columna que recoge las probabilidades a posteriori de cada término que se calcularon en la Tabla 6. Se dispone, por tanto, de información referida a la población de la que procede la muestra, relativa a:   Medida de la tendencia de cada palabra para ser mencionada en la encuesta (probabilidad a posteriori). Medida de la probabilidad de cada palabra para aparecer en todas y cada una de las posiciones de las listas. Este indicador se ha trasladado a la Tabla 7.
Tabla 7

22

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Los números contenidos en cada celda responden al cociente
Frecuencia de la palabra en la posición Total de términos hasta la posición

Se va a contar ahora con dos medidas de probabilidad, una a priori y otra condicionada, que facilitan el recurso al teorema del producto o probabilidad compuesta y, consecuentemente, conocer la posibilidad que tiene una palabra para ser elegida por un informante, y serlo en una determinada posición La probabilidad compuesta, o regla de multiplicación de probabilidades, se deriva de la probabilidad condicionada. Contempla la ocurrencia simultánea de dos sucesos (suceso intersección de “A” y “B”). Es igual a la probabilidad a priori del suceso “A”, multiplicada por la probabilidad del suceso “B” condicionada al cumplimiento del suceso “A”
1982:47-48], [AMÓN, J.

es decir:

Probabilidad (A B)

Probabilidad (A)

Probabilidad (B/A)

La probabilidad del vocablo “m” para ser actualizado y mencionado en primera posición, P(m) en el lugar “L1". Se concreta en la expresión:
(L1)

quedará determinada mediante el producto de dos tendencias, la

probabilidad de elección de la palabra “m” y la probabilidad de aparición de la palabra “m” en

P ( m ) en ( L )
1

Pm

PL

1/ m

donde

P Pm P L1/m

es probabilidad es probabilidad de la palabra m es lugar probabilidad condicional de m respecto a L1

23

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Si se busca un indicador ρ capaz de resumir en un número la suma de las posibilidades que una palabra, “m”, tiene de ser actualizada en cualquier posición de las listas, su cálculo responderá a
x n 1 P (L x / m )

ρm

P

m

x

donde Pm

es probabilidad a priori de la palabra m Lx es lugar P(Lx / m) es probabilidad de la palabra m en la posición Lx

La Tabla 8 contempla en su columna final la suma perseguida.
Tabla 8

No obstante, los resultados alcanzados precisan corrección porque la suma de las probabilidades calculadas no es igual a la unidad (el suceso seguro siempre debe ser 1). Se puede acudir de nuevo a la probabilidad condicional P (Lx / m).

P (L X/m)

Frecuencia de m en L x Total de términos hasta Lx

F(m /Lx) tL x

donde

Lx F(m/Lx) tLx

es lugar es frecuencia de m en posición Lx es total de entradas hasta la posición Lx

24

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

La probabilidad a priori de “m” era
Frecuencia de m Total de palabras recogidas Fm T

Probabilidad a priorim

donde

Fm T

es frecuencia final de m es total de entradas recogidas

Por lo tanto se puede rescribir la fórmula del modo siguiente:
F x
m

n 1

ρm

F

m /L x

T

x

tLx

donde

T Fm Fm/Lx tLx

es número total de entradas recogidas es frecuencia final de la palabra m. es frecuencia de la palabra m en la posición x. es total de entradas hasta la posición Lx.

El análisis del algoritmo de cálculo demuestra que 1. El primer factor del producto responde a la probabilidad teórica de aparición de la palabra “m”, es decir, a su probabilidad a priori. 2. El segundo factor contempla la suma de las probabilidades de ocurrencia de la palabra “m” en determinadas condiciones, en este caso, que “m” ocupe una posición concreta. En definitiva representa una suma de verosimilitudes. Se trata, en definitiva, del producto de probabilidades a priori de la palabra “m” por una sucesión de verosimilitudes. Se puede acudir, de nuevo, al Teorema de Bayes y dividir cada celda de la columna “total” de la Tabla 8 entre la suma de todos los valores que contiene, como se hace en la Tabla 9. Se obtiene una medida ponderada (columna “probabilidad a posteriori”), en un rango entre cero y uno, cuya suma es igual a la unidad según exige la condición probabilística.

25

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Tabla 9

Este número es el que se ofrece como índice de disponibilidad léxica. Su notación matemática podría ser
Fm Disponibilidad Palabra T
m

x n F m /Lx tL x x 1 Fm T x n F m /Lx x 1 t Lx

m n m 1

donde:

T Fm FmLx tLx

es número total de entradas actualizadas es frecuencia final de la palabra m. es frecuencia de la palabra m en la posición Lx. es total de entradas hasta la posición x.

Es, en definitiva, un cociente cuyo numerador contempla el producto de dos factores
Fm T es Frecuencia de la palabra Total de entradas

x n F m /L x x 1 tL
x

es suma de cocientes

Frecuencia

de m en cada posición

Total de entradas hasta esa posición

El denominador, por su parte, recoge la suma de los productos correspondientes a todos los vocablos admitidos.

26

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

El método parece satisfacer las cláusulas exigidas para validarlo como procedimiento alternativo. Sus rasgos definitorios son  Opera con valores referidos a o Número total de actualizaciones aceptadas (T). o Frecuencia de cada término o entrada admitida como válida (F). o Frecuencia de la palabra en cada posición (Fm/Lx). o Total de palabras recogidas hasta cubrir cada posición (tLx).    No existen constantes ni referencias generadas fuera de la propia muestra. Los pesos asignados al conjunto de primeras menciones suman 1. Las posiciones son matizadas por un elemento ponderador que decrece de forma variable de acuerdo con la importancia relativa de cada lugar en la totalidad de la encuesta. Un ejemplo de esa evolución se aprecia en la Tabla 10. Nótese que el total de menciones es constante en los tres casos.

Tabla 10

Para conocer exactamente como han operado los mecanismos de cálculo y ponderación sobre las variables, se han hallado los coeficientes de correlación que resultan de cruzar las frecuencias de las palabras en las posiciones con los índices de disponibilidad que se consiguen por este procedimiento. La información se encuentra en la Tabla 11 y permite extraer algunas conclusiones:
27

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Tabla 11

1. El elemento con mayor presencia en la puntuación última alcanzada es, y no podía ser de otro modo, la frecuencia final (F) que alcanza una correlación de 0.94. 2. La trascendencia de la posición varía radicalmente de las primeras a las últimas. La oscilación se encuentra dentro del rango comprendido entre + 0.89 y - 0.19.

En la que sigue, Tabla 12, se comparan las relaciones ordenadas de vocablos que derivan de aplicar los criterios frecuencia de aparición y disponibilidad léxica. Se comprueba aquí que la incidencia del lugar en que aparece la mención es más significativa en las frecuencias medias, lo cual era previsible a la vista de los coeficientes de correlación estimados. Se demostrará posteriormente que la variación crece en razón directa al total de vocablos emitidos por la muestra, esto es, a la variable T.
Tabla 12

28

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Todo el proceso reflexivo desarrollado hasta ahora se ha apoyado sobre datos teóricos. A continuación se exponen los resultados que se alcanzan cuando se ensaya el método sobre una muestra representativa y estadísticamente fiable. Se trabaja con la encuesta realizada a mil quinientos quince alumnos de Almería, con edades comprendidas entre los nueve y los doce años, referida al centro de interés 01, “Las partes del cuerpo”. Se resume en la Tabla 13. El total de menciones recogidas asciende a veintidós mil ciento dieciocho. El número de entradas diferentes, después de unificar vocablos, es de trescientos cuarenta y cinco. Los números en detalle son, por tanto: • • • • Informantes: 1 515 nP: 345 T: 22 118 Correlación disponibilidad - frecuencia: 0.883789
Tabla 13

29

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Esta Tabla evidencia dos realidades: 1. La ponderación del factor posición con listas entre una y treinta palabras, se mueve dentro del rango 1 - 0.00005. 2. La correlación calculada para la par disponibilidad - frecuencia en la posición, tiene las oscilaciones consecuentes con los pesos que la propia muestra otorga. La tendencia se dibuja en el Gráfico 6. Permítase, antes de analizar este dibujo, un breve comentario acerca de los coeficientes de correlación. Cuando dos fenómenos sociales, físicos o biológicos, crecen o decrecen de forma simultánea y proporcional debido a factores externos, se dice que están positivamente correlacionados. Si uno crece en la misma proporción que el otro decrece, los dos fenómenos están negativamente correlacionados. Una correlación positiva perfecta tiene un coeficiente + 1. Una correlación negativa perfecta tiene un coeficiente 1. La ausencia de correlación se manifiesta en un coeficiente 0. Por ejemplo, el coeficiente 0.89 indica una correlación positiva grande, 0.76 es una correlación negativa grande y 0.13 es una correlación positiva pequeña. El más usado de los coeficientes de correlación es el propuesto por Karl Pearson. Su índice está pensado para cuantificar esta medida cuando la variación es lineal. Se denomina correlación lineal, aquella cuya representación gráfica presenta una nube de puntos próxima a una línea recta. Se obtiene dividiendo la covarianza entre el producto de las desviaciones estándar de ambas variables. Pero no siempre la relación entre las variables se ajusta a este modelo. En esos casos el coeficiente Pearson no es apropiado por lo que conviene utilizar otros indicadores
BARÓN; SÁNCHEZ y PARRAS. 1995]. [RÍUS;

Si se calcula el coeficiente Pearson para las variables disponibilidad y frecuencia en la experiencia recogida en la Tabla 13, se estima en 0.88. Es un indicador alto, que dice mucho de la importancia de la frecuencia, pero claramente inferior a los que resultan de tratar la misma muestra con los procedimientos de López Chávez y Strassburger o López Morales y Lorán (λ = 0.9). En estos casos se mueve alrededor del 0.95. Ello es un síntoma claro del mayor peso específico que, en la estrategia de cálculo de la disponibilidad que aquí se propone, se concede al factor posición.

30

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

El análisis de la misma correlación, pero referida a las frecuencias habidas en cada lugar de las listas, confirma que el modelo comparte con los anteriormente la misma tendencia general, pero es mucho más sensible a las variaciones y circunstancias de los datos. Gráfico 6

Obsérvese, con esta intención, en el Gráfico 6, la aparente disfunción que significa el coeficiente calculado para la “posición 29”. La explicación es simple. El “lugar 29" es alcanzado por un solo informante que actualiza allí la palabra “mano”. El término es el tercero más disponible del conjunto ordenado según disponibilidad y el sexto atendiendo a la frecuencia absoluta. Cabe, por tanto, aventurar que lo anormal y anecdótico es su aparición en un lugar tan atrasado y que corresponde a un caso extremo y poco significativo. Por eso el índice de correlación está muy por encima del que le correspondería sólo por posición. Otro aspecto interesante es la evolución del agente multiplicador que pondera la significación de la posición. La Tabla 14 y el Gráfico 7, que siguen, recogen este detalle. La cifra resaltada en negrita corresponde al coeficiente compensador que, multiplicado por la frecuencia, cuantifica la posición.

31

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com Tabla 14

Gráfico 7

32

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Recuérdese que no es más que una medida de probabilidad que depende del número de actualizaciones que aparecen en la posición y del total de menciones habidas hasta cubrir la posición en cuestión (véase Tabla 10). En páginas siguientes se reproducen fragmentos de la Tabla de Frecuencias de la encuesta mencionada y de los índices de disponibilidad léxica alcanzados. Se incluyen dos relaciones con los términos aparecidos. La primera presenta las palabras ordenadas de mayor a menor disponibilidad y la segunda sigue un criterio alfabético para facilitar consultas concretas.

33

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Pantalla de TABLA DE FRECUENCIAS Fragmento de la resultante en el estudio de los coeficientes de disponibilidad léxica de términos relacionados con el “cuerpo humano”, en niños con edades comprendidas entre los nueve y los doce años de la ciudad de Almería.
Producida por la aplicación DLEXUAL (Hojas de cálculo relacionadas) elaborada por este autor para alcanzar los coeficientes de disponibilidad léxica.

34

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Fragmento de listado alfabetizado de coeficientes de disponibilidad léxica de términos relacionados con el “cuerpo humano”, en niños con edades comprendidas entre los nueve y los doce años de la ciudad de Almería, según la fórmula aquí defendida.
Producido por la aplicación DLEXUAL (Hojas de cálculo relacionadas) elaborada por este autor para alcanzar los coeficientes de disponibilidad léxica.

35

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Reproducción del listado completo de coeficientes de disponibilidad léxica atribuidos a los términos relacionados con el “cuerpo humano”, en niños con edades comprendidas entre los nueve y los doce años de la ciudad de Almería, según la fórmula aquí defendida.
Producido por la aplicación DLEXUAL (Hojas de cálculo relacionadas) elaborada por este autor para alcanzar los coeficientes de disponibilidad léxica.

CENTRO DE INTERÉS - 01 - LAS PARTES DEL CUERPO Coeficientes de Disponibilidad Léxica de términos aparecidos en la encuesta. Ordenación decreciente de índices
Frecuencia 800 985 786 874 786 717 651 816 731 758 764 439 510 419 433 421 275 331 293 368 317 303 275 202 246 180 221 246 222 200 214 151 155 194 152 172 195 Disponibilidad 0,130790786 0,115147647 0,075934396 0,069436876 0,065771647 0,064635222 0,058445556 0,057042245 0,048770972 0,046417482 0,036741519 0,028447394 0,026380663 0,021391526 0,014146016 0,011666149 0,009475968 0,009010618 0,008324671 0,006233611 0,005843407 0,005608573 0,005336801 0,005112428 0,005026659 0,004693109 0,004381850 0,003460807 0,003376755 0,003308423 0,002878485 0,002625616 0,002267421 0,002178753 0,002172970 0,002096382 0,002053930 Palabra Cabeza Ojo Mano Nariz Pierna Brazo Corazón Boca Pie Oreja Dedo Hueso Pulmón Cerebro Pelo Rodilla Músculo Estómago Hígado Uña Diente Codo Cuello Fémur Costilla Cráneo Radio Lengua Vena Pene Hombro Cara Riñón Tobillo Tibia Columna vertebral Muñeca Nº de Orden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

36

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com
Frecuencia 154 134 152 175 147 161 127 156 137 142 111 113 112 106 113 96 106 114 78 111 84 65 82 83 83 64 72 91 75 61 83 56 81 43 61 58 62 67 64 54 50 46 29 47 46 51 43 45 41 40 37 38 39 36 38 42 Disponibilidad 0,002016534 0,001766740 0,001739468 0,001631483 0,001597513 0,001428975 0,001319718 0,001265359 0,000966596 0,000953660 0,000895225 0,000879284 0,000815810 0,000794209 0,000793963 0,000712495 0,000709533 0,000686377 0,000660185 0,000573239 0,000509174 0,000489733 0,000471272 0,000465235 0,000459584 0,000449185 0,000427581 0,000402085 0,000390762 0,000388406 0,000381662 0,000366350 0,000334103 0,000287950 0,000286823 0,000286141 0,000281390 0,000270857 0,000264044 0,000250680 0,000199704 0,000181448 0,000180382 0,000165131 0,000159102 0,000146719 0,000144793 0,000141101 0,000134862 0,000125555 0,000122706 0,000120201 0,000098344 0,000093816 0,000092741 0,000085614 Palabra Peroné Tronco Intestino Barriga Gemelo Ceja Cúbito Muslo Pecho Espalda Esófago Bíceps Ombligo Faringe Oído Arteria Sangre Culo Húmero Pestaña Ano Tórax Laringe Intestino grueso Intestino delgado Extremidad Omóplato Labio Páncreas Rótula Cadera Clavícula Vagina Esqueleto Tráquea Vulva Testículo Piel Glúteo Cerebelo Esternón Bronquio Órgano Abdomen Mandíbula Garganta Pelvis Tríceps Carne Tímpano Esternocleidomastoideo Tripa Vejiga Tendón Antebrazo Cintura Nº de Orden 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93

37

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com
Frecuencia 43 31 42 37 35 24 26 27 29 23 24 26 25 29 20 16 22 20 14 21 16 17 15 21 12 19 15 12 13 11 19 15 18 15 18 13 12 15 10 11 15 10 15 13 8 11 13 14 14 9 13 11 10 12 12 8 Disponibilidad 0,000083876 0,000073320 0,000072824 0,000069026 0,000067251 0,000059852 0,000059589 0,000057481 0,000049962 0,000042079 0,000040640 0,000032552 0,000031395 0,000030117 0,000025433 0,000024047 0,000021705 0,000021116 0,000020332 0,000019937 0,000019315 0,000018517 0,000017873 0,000017019 0,000015741 0,000015670 0,000015094 0,000015090 0,000013159 0,000013131 0,000012793 0,000012714 0,000012614 0,000012464 0,000011884 0,000011733 0,000011720 0,000011167 0,000010323 0,000010024 0,000009931 0,000009447 0,000009281 0,000008935 0,000008320 0,000007982 0,000007885 0,000007862 0,000006910 0,000006686 0,000006437 0,000006287 0,000006189 0,000005992 0,000005846 0,000005792 Palabra Teta Vértebra Frente Pupila Nervio Cuerpo Célula Frontal Ovario Útero Trapecio Cuádriceps Iris Talón Capilar Encéfalo Nuca Uretra Mama Articulación Bulbo raquídeo Caja torácica Fosa nasal Ingle Aparato digestivo Barbilla Pómulo Deltoides Tarso Aparato excretor Nudillo Caracol Moflete Alveolo Sobaco Bronquiolo Coxis Parietal Vesícula Diafragma Falange Nasal Uréter Trasero Bazo Aparato respiratorio Carpo Metatarso Muela Escroto Párpado Vista Espermatozoide Pectoral Espinilla Bilis Nº de Orden 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149

38

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com
Frecuencia 8 9 9 11 10 9 11 11 10 10 6 6 10 9 9 5 9 9 8 8 9 7 8 7 9 7 6 6 6 8 6 7 7 7 6 7 4 8 6 7 6 7 7 6 6 6 5 5 5 5 5 6 6 6 6 6 Disponibilidad 0,000005780 0,000005694 0,000005613 0,000005454 0,000005081 0,000004856 0,000004780 0,000004719 0,000004509 0,000004223 0,000003972 0,000003956 0,000003893 0,000003823 0,000003541 0,000003465 0,000003415 0,000003396 0,000003391 0,000003342 0,000003227 0,000003108 0,000003030 0,000003023 0,000002744 0,000002726 0,000002695 0,000002587 0,000002513 0,000002502 0,000002483 0,000002483 0,000002390 0,000002381 0,000002336 0,000002303 0,000002230 0,000002192 0,000002185 0,000002129 0,000001932 0,000001924 0,000001858 0,000001842 0,000001832 0,000001831 0,000001797 0,000001783 0,000001684 0,000001654 0,000001542 0,000001486 0,000001471 0,000001467 0,000001458 0,000001442 Palabra Aparato reproductor Óvulo Apéndice Mejilla Colon Píloro Planta del pie Metacarpo Occipital Encía Ventrículo Cabello Abdominal Cuerda vocal Recto Matriz Tacto Sexo Glándula salival Maxilar superior Seno Trompa de Falopio Axila Médula espinal Papila gustativa Maxilar inferior Aparato circulatorio Plaqueta Cartílago Maxilar Chocho Vello Temporal Pubis Meñique Pompi Pituitaria Saliva Ligamento Olfato Retina Nalga Cristalino Glóbulo blanco Glóbulo rojo Picha Pellejo Glándula Masetero Jugo gástrico Sentidos Pezón Glándula sudorípara Íleon Campanilla Yema Nº de Orden 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205

39

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com
Frecuencia 3 5 5 5 5 5 3 4 4 5 4 4 3 4 4 4 4 4 4 4 4 4 3 4 4 3 3 3 3 3 2 3 3 3 3 1 1 2 3 3 3 3 2 3 3 3 2 3 2 3 3 3 2 2 2 2 Disponibilidad 0,000001440 0,000001238 0,000001173 0,000001123 0,000001122 0,000001075 0,000001052 0,000000937 0,000000930 0,000000917 0,000000899 0,000000823 0,000000812 0,000000807 0,000000771 0,000000667 0,000000653 0,000000627 0,000000616 0,000000606 0,000000600 0,000000599 0,000000579 0,000000577 0,000000564 0,000000507 0,000000501 0,000000488 0,000000479 0,000000467 0,000000460 0,000000457 0,000000446 0,000000434 0,000000405 0,000000403 0,000000403 0,000000388 0,000000382 0,000000382 0,000000380 0,000000379 0,000000366 0,000000352 0,000000346 0,000000304 0,000000300 0,000000298 0,000000289 0,000000284 0,000000281 0,000000276 0,000000268 0,000000237 0,000000237 0,000000223 Palabra Molar Gusto Vaso sanguíneo Trapezoide Pantorrilla Médula Médula ósea Huevos Grasa Vena Cava Epiglotis Glóbulo Esclerótica Grano Cardias Colmillo Duodeno Barba Nuez Poro Paladar Dorsal Sesos Quimo Dermis Jugo pancreático Martillo Pabellón auditivo Vena Aorta Aparato Sudor Tabique nasal Dedo corazón Pito Espina dorsal Válvula Tiroides Clítoris Orina Pulgar Mandíbula superior Cadena de huesecillos Labio mayor Mandíbula inferior Bigote Dentadura Cervical Quilo Nervio óptico Peca Aurícula Tendón de Aquiles Tejido Mucosa Orificio nasal Aparato urinario Nº de Orden 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261

40

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com
Frecuencia 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Disponibilidad 0,000000207 0,000000202 0,000000202 0,000000198 0,000000194 0,000000194 0,000000191 0,000000179 0,000000177 0,000000176 0,000000166 0,000000160 0,000000160 0,000000147 0,000000144 0,000000144 0,000000139 0,000000137 0,000000135 0,000000135 0,000000135 0,000000134 0,000000128 0,000000127 0,000000126 0,000000120 0,000000102 0,000000102 0,000000102 0,000000102 0,000000082 0,000000082 0,000000082 0,000000082 0,000000082 0,000000068 0,000000068 0,000000068 0,000000059 0,000000059 0,000000052 0,000000052 0,000000052 0,000000047 0,000000047 0,000000047 0,000000047 0,000000047 0,000000043 0,000000043 0,000000043 0,000000040 0,000000040 0,000000040 0,000000040 0,000000037 Palabra Sartorio Asadura Tejido muscular Córnea Genital Índice Ciego Lunar Yeyuno Vía respiratoria Vena Pulmonar Tubo digestivo Membrana Vesícula seminal Premolar Paleta Aparato locomotor Yunque Glándula suprarrenal Hormona Órgano reproductor Vientre Puño Bolo alimenticio Arruga Calva Labio menor Laberinto Palma Alma Falangina Coco Verga Espíritu Mancha de nacimiento Falangeta Tuétano Órgano visual Polla Fontanela Ubre Ganglio Chumino Aparato femenino Cintura pelviana Feto Morrillo Gusanillo Cintura escapular Aparato masculino Toto Meninge ADN Nervio auditivo Cola Mentón Nº de Orden 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317

41

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com
Frecuencia 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Disponibilidad 0,000000037 0,000000037 0,000000035 0,000000035 0,000000035 0,000000035 0,000000033 0,000000033 0,000000032 0,000000032 0,000000032 0,000000032 0,000000032 0,000000032 0,000000030 0,000000030 0,000000030 0,000000030 0,000000030 0,000000029 0,000000029 0,000000029 0,000000029 0,000000029 0,000000028 0,000000028 0,000000028 0,000000028 Palabra Dedo gordo Boca del estómago Vena Renal Torso Plasma Coño Menisco Célula cerebral Axón Verruga Heces Empeine Perilla Sal Juanete Incisivo Variz Órgano genital Pipí Moco Arañazo Carrillo Conducto nasal Cutis Cordón umbilical Caspa Isquion Cuero cabelludo Nº de Orden 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345

42

ANTONIO ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Bibliografía
AMÓN, Jesús. (1982). Estadística para psicólogos (Probabilidad y estadística inferencial). Tomo II. Neurociencia. Editorial Pirámide. Madrid. ----, (1990). Estadística para psicólogos I. (Estadística descriptiva). Psicología, 12. Pirámide, Madrid. BAYES, Thomas. (1908). Versuch zur Lösung eines Problems der Wahrscheinlichkeitsrechnung. Engelmann. Leipzig. BUTRÓN, Gloria Izaskun. (1987). El léxico disponible: índices de disponibilidad. Disertación presentada en la Universidad de Puerto Rico como requisito para la obtención del grado de Doctor en Filosofía y Letras. Puerto Rico. LAPLACE, Pierre Simón de. (1812). Théory analytique des probabilités. Courcier. París. ----, (1825). Essai philosophique sur les probabilités. Badhelier. París. QUESADA PALOMA, V.; ISIDORO MARTÍN, A. y LÓPEZ MARTÍN, L. A. . (1982). Curso y ejercicios de estadística. 2ª ed. Alhambra, Madrid. RÍUS, F.; BARÓN, F. J.; SÁNCHEZ, E. y PARRAS, L. (1995). Bioestadística: métodos y aplicaciones. SPICUM, Universidad de Málaga. Málaga.

43