You are on page 1of 222

RESOLUCIÓN DE HIATOS EN VERBOS –EAR: UN ESTUDIO

SOCIOFONÉTICO EN UNA CIUDAD MEXICANA

DISSERTATION

Presented in Partial Fulfillment of the Requirements for the Degree Doctor of Philosophy
in the Graduate School of The Ohio State University

By

Edith Hernández, M.A.

Graduate Program in Spanish and Portuguese

The Ohio State University

2009

Dissertation Committee:

Professor Scott A. Schwenter, Advisor

Professor Terrell A. Morgan

Professor Rebeka Campos-Astorkiza


Copyright by

Edith Hernández

2009
ABSTRACT

This dissertation investigates the linguistic and social constraints that condition variation

in hiatus resolution in –ear verbs in Mexican Spanish. Previous literature on hiatus

resolution suggests a tendency in many languages, including Spanish, to avoid adjacent

heterosyllabic vowels by employing different strategies to resolve hiatus. This array of

possibilities to deal with heterosyllabic vowel sequences could therefore yield a

heterogeneous variation showing both intra-speaker and inter-speaker variation.

Moreover, the distinction between one strategy and another can sometimes be misleading

or imprecise to the untrained ear and the real pool of strategies can extend beyond our

own perception. On social grounds, some resolution strategies in Spanish, like

diphthongization with a high glide, have been associated with people who are rural,

illiterate or from lower social classes.

This dissertation contributes to the literature on hiatus resolution in Spanish by describing

and analyzing six different strategies used at the lexical level, particularly with –ear verbs

in Mexican Spanish. A variationist methodology along with an experimental approach

were used to identify the acoustic cues that distinguish several different strategies for

resolving hiatus, and to discover the significant internal and external factors constraining

variation in hiatus resolution in the vowel sequences derived from –ear verbs.
ii
The acoustic results show that hiatuses are distinct from diphthongs in duration on

average, but that duration is not a very reliable cue because of frequent speech rate

changes even within the same speaker. Other cues considered for the definition of the

strategies are the rate of the transition curve and its increase/decrease rate; F1 and F2

values; wave forms, and auditory impression. On average, the rate of the transition curve

is higher in hiatuses, and the F2 values are higher in diphthongs in their initial stage than

those of hiatuses. F1 values provide an acoustic cue for distinguishing a mid-glide from a

high glide.

Six strategies were identified in the resolution of contiguous vowel sequences in –ear

verbs: hiatus maintenance, diphthong formation with mid glide, diphthong formation with

high glide, elision, hiatus with a high vowel, and coalescence. The results show that

hiatus resolution is a linguistically and socially conditioned phenomenon. Stress was

found to be the main structural constraint followed by the V2 quality and the type of

syllable. Age, education, and sex were the social factors affecting the strategies selected

by the informants.

The most favored hiatus resolution strategies in descending order were diphthong

formation with mid glide, maintenance of hiatus, diphthong formation with high glide,

and elision. While diphthong formation with a high glide is favored by women, the oldest

group, and also people with a low education level, diphthong formation with a mid glide

is led by men, the youngest groups, and people with a university or graduate level of

education. The results and analysis of the speech community suggest the presence of a

change in progress having as its most global innovative variant diphthong formation with

iii
a mid glide, which is distinguished from the local variant, the diphthong with a high

glide. The persistence of different resolution strategies, in contrast to hiatus maintenance,

reconfirms the anti-hiatus tendency of Mexican Spanish.

iv
ACKNOWLEDGMENTS

This thesis would not have been possible without the guidance and support of many

people. I owe my deepest gratitude to my advisor, Scott Schwenter whose

encouragement, guidance and support from the beginning to the end of my studies

enabled me to understand and become fascinated by linguistics. I am grateful for the

questions, comments and suggestions he offered me for my dissertation. His expertise

and insightful comments were a great contribution to this study.

I would like to thank also the committee members. It was in Terrell Morgan’s courses

where my initial ideas about this dissertation arose. I am thankful for his generosity,

patience and disposition to discuss my ideas. I thank Terrell the opportunity to work with

him as his research assistant. Terrell has been an inspiration to continue working on

phonetics and phonology. My gratitude also goes to Rebeka Campos-Astorkiza, for

generously dedicating time and effort to read and enrich this dissertation.

I would also like to thank my friends and most of them fellow graduate students, Assela

Reig, Carolina Castillo, Andy Lewis, Manuel Delicado, Magdalena Mejia, Marissa

Vargas, and Gilberto Velázquez for their friendship, support and encouragement during

my stay at OSU.

v
Quisiera agradecer también a todos los informantes que participaron en esta investigación

por su colaboración y disposición. También a mi familia, gracias en especial a mi

hermana Griselda por su siempre apoyo y ánimo a la distancia. Y finalmente, gracias a

Alfredo, mi compañero de vida, quien de inicio a fin me apoyó en esta aventura en todos

los sentidos y en todas las maneras posibles. Gracias por regalarme ideas, hipótesis, y

ayudarme a entender estadística.

vi
VITA

1995……………….B.A. TEFL, Universidad Veracruzana

2000 ………………M. A. Teaching Spanish as a FL, Universidad de Alcalá de Henares

2006 ………………M.A, Hispanic Linguistics, The Ohio State University

PUBLICATIONS

Hernández Méndez E, (forthcoming). La enseñanza de la pronunciación. In R. Reyes


(Ed.) Creencias, estrategias y pronunciación en la enseñanza- aprendizaje de lenguas.

Hernández Méndez, E. (2008). Perspectivas y experiencia docente en la enseñanza de la


pronunciación. Memorias del XXII Foro de Especialistas Universitarios en Lenguas
Extranjeras. Chiapas, Mexico.

Hernández Méndez, E. & Bye, B. (2003). Los alternantes paralingüísticos en español.


Anuario de la División de Estudios Internacionales y Humanidades. Universidad de
Quintana Roo.

Boxill, I. & Hernandez, E. (2002). How tourism transforms language: the case of Playa
del Carmen, Mexico. Social and Economic Studies, 51(1), 47-60.

FIELDS OF STUDY

Major Field: Spanish and Portuguese

Studies in: Sociolinguistics and Psycholinguistics


vii
TABLE OF CONTENTS

ABSTRACT........................................................................................................................ ii

ACKNOWLEDGMENTS .................................................................................................. v

VITA ................................................................................................................................. vii

TABLE OF CONTENTS................................................................................................. viii

LIST OF TABLES............................................................................................................ xii

LIST OF FIGURES ......................................................................................................... xiv

CAPÍTULO 1: INTRODUCCIÓN ..................................................................................... 1

1.1 Panorama general ...................................................................................................... 7

CAPÍTULO 2: REVISIÓN DE LA LITERATURA Y MARCO TEÓRICO .................. 10

2.1 Resolución de hiato en español ............................................................................... 10

2.2. Variación en la resolución de hiatos en español .................................................... 17

2.2.1 Variación y factores externos ........................................................................... 17

2.2.2 Variación y factores internos ............................................................................ 23

2.3 Factores lingüísticos como condicionantes de la resolución de hiatos ................... 35

viii
2.4 Vocales y deslizadas................................................................................................ 38

2.4.1 Vocales y deslizadas desde un punto de vista fonético .................................... 38

2.4.2 El caso de las deslizadas medias...................................................................... 44

2.4.3 Vocales y deslizadas desde una perspectiva fonológica................................... 55

2.5 Sonoridad y resolución de hiatos ............................................................................ 61

2.6 Acento y resolución de hiato ................................................................................... 70

2.6.1 La función del acento en la resolución de hiato ............................................... 72

CAPÍTULO 3: MÉTODO, VARIABLES E HIPÓTESIS................................................ 76

3.1 Teoría de la variación y metodología variacionista ................................................ 76

3.2 Método experimental............................................................................................... 79

3.3 Definición de variables............................................................................................ 80

3.3.1 Variable lingüística dependiente y sus variantes.............................................. 80

3.3.2 Las variables lingüísticas independientes......................................................... 81

3.3.3 Variables externas independientes.................................................................... 83

3.4 Definición de contextos lingüísticos de la variable: e + V...................................... 91

3.5 Hipótesis................................................................................................................. 92

3.6 Sujetos ..................................................................................................................... 93

3.6.1 Población .......................................................................................................... 93

3.6.2 Muestra ............................................................................................................. 95

ix
3.7 Instrumentos ........................................................................................................... 97

3.7.1 La entrevista sociolingüística ........................................................................... 97

3.7.2 Prueba de sombreado y reconstrucción fonética .............................................. 99

3.7.3 Prueba de transformación ............................................................................... 102

3.8 Procedimientos para el análisis de los datos ......................................................... 103

3.8.1 Análisis acústico ............................................................................................. 104

3.8.2 Análisis estadístico ........................................................................................ 110

CAPÍTULO 4 ANÁLISIS DE LOS RESULTADOS.................................................... 112

4. 2 Análisis de los resultados estadísticos de GoldVarb ............................................ 119

4.2.1 Variante mantenimiento del hiato................................................................... 123

4.2.2. Variante formación de diptongo con deslizada media................................... 127

4.2.3 Variante formación de diptongo con deslizada alta........................................ 134

4.2.4. Variante elisión.............................................................................................. 139

4.2.5 Variantes hiato con vocal alta /i/ y fusión ...................................................... 140

4.3 Discusión de los resultados ................................................................................... 145

CAPITULO 5: CONCLUSIONES Y COMENTARIOS ............................................... 161

5.1 Conclusiones ......................................................................................................... 161

5. 2 Futuros estudios.................................................................................................... 167

REFERENCIAS.............................................................................................................. 173

x
APÉNDICE A: Protocolo de entrevista ......................................................................... 189

APÉNDICE B: Técnica de sombreado y reconstrucción fonética.................................. 191

APÉNDICE C: Prueba de transformación...................................................................... 193

APÉNDICE D: dibujos para la prueba de sombreado y reconstrucción fonética........... 195

APÉNDICE E: The Ohio State University Consentimiento para participar en la

investigación ................................................................................................................... 203

xi
LIST OF TABLES

Tabla 1. Ingresos medios equivalentes del hogar ............................................................. 88

Tabla 2. Nivel educativo y subfactores............................................................................. 89

Tabla 3. Variables internas ............................................................................................... 91

Tabla 4. Variables externas............................................................................................... 91

Tabla 5. Habitantes por grupos etarios ............................................................................. 94

Tabla 6. Distribución de la muestra .................................................................................. 96

Table 7. Duración de hiatos y diptongos en entrevista y prueba de sombreado ............. 112

Tabla 8. Duración de hiatos y diptongos en prueba de transformación.......................... 112

Tabla 9. Valores de F2 en hiato y diptongo .................................................................... 114

Tabla 10. Tasa de crecimiento de la trayectoria de F2 ................................................... 115

Tabla 11. Factores que contribuyen a la selección de la variante /e/ (hiato). ................ 124

Tabla 12. Variables acento y grado de sonoridad con hiato ........................................... 125

Tabla 13. Factores que contribuyen a la selección de la variante /e/ (diptongo con

deslizada con media)....................................................................................................... 127

Tabla 14. Relación acento y grado sonoridad en diptongos con deslizada media .......... 129

Tabla 15. Variables instrumento y nivel educativo con deslizada media ....................... 132

xii
Tabla 16. Factores que contribuyen a la selección de la variante /j/ (diptongo con

deslizada alta).................................................................................................................. 134

Tabla 17. Variables vocal siguiente y tipo de sílaba....................................................... 135

Tabla 18. Variables sexo y nivel educativo con /j/ ......................................................... 137

Tabla 19. Variables sexo y edad con /j/ .......................................................................... 138

Tabla 20. Tabla comparativa de estrategias con factores condionantes ......................... 142

Table 21. Resumen de grupos factoriales significativos por estrategia de resolución.... 145

xiii
LIST OF FIGURES

Figura 1 Continuo diptongo-hiato en lenguas romances .................................................. 33

Figura 2. Espectrogramas de [aia], [ai̯ a], y [aja]............................................................. 41

Figura 3. Secuencia [a ‘i] en hiato en copa hípica........................................................... 42

Figure 4. Secuencia [‘ai] en diptongo en patata iqueña. .................................................. 43

Figura 5. Secuencia [a ´e] en lindes de palabra: hiato en estopa épico. ........................... 47

Figura 6. Secuencia [‘ta ek] en lindes de palabras: diptongo en tacatá ecológico. ........ 48

Figura 7. Secuencia [‘ta ik] en lindes de palabras: diptongo en patata iqueña. .............. 49

Figura 8. Estructura silábica de Selkirk ............................................................................ 56

Figura 9. La sílaba en CV ................................................................................................. 56

Figura 10. Diptongo e hiato en CV ................................................................................... 57

Figura 11. Escala universal de sonoridad ......................................................................... 57

Figura 12. La sílaba en la teoría X .................................................................................... 58

Figura 13. La sílaba en la teoría moraica .......................................................................... 59

Figura 14. Diptongo en rumano ........................................................................................ 60

Figura 15. Secuencia deslizada-vocal en rumano ............................................................. 60

Figura 16. Escala de sonoridad en español ....................................................................... 62

Figura 17. La variable linguística y sus variantes............................................................. 80


xiv
Figura 18. Ubicación de Chetumal ................................................................................... 94

Figura 19 Secuencia /ea/ seguida de nasal alveolar ....................................................... 105

Figure 20 ¨batearán ......................................................................................................... 106

Figura 21. Pendiente completa en hiato y diptongo........................................................ 114

Figura 22. Hiato en“pateo” ............................................................................................. 117

Figura 23. Diptongo con deslizada media en “pateó”..................................................... 117

Figura 24. Diptongo con deslizada alta en “pateó”......................................................... 118

Figura 25. Variable lingüística y sus variantes ............................................................... 121

Figure 26. Distribución de las variantes principales de resolución ................................ 122

Figura 27. Variables edad e instrumento con /e/ por porcentaje..................................... 126

Figure 28. Relación edad e instrumento en diptongo con deslizada media .................... 130

Figura 29. Relación edad y nivel educativo con /e/ en porcentajes ................................ 131

Figura 30. Relación sexo y nivel educativo con /e/ en porcentajes ................................ 132

Figura 31. Relación sexo y nivel educativo con /e/ en porcentajes ................................ 133

Figura 32. Relación edad y nivel educativo con /j/......................................................... 136

Figura 33. Relación acento y nivel educativo con variante /j/ ........................................ 139

xv
Capítulo 1: Introducción

El español es una lengua que en la actualidad se habla en más o menos una veintena de

países por más de 400 millones de hablantes, aproximadamente. Sin embargo, en cada

país y en cada zona dialectal o comunidad de habla se observan peculiaridades, cambios

y variaciones del sistema que ponen de relieve su inherente dinamismo. Esta variación

del sistema puede reflejarse en los diferentes niveles de análisis de la lengua: fonético-

fonológico, morfológico, sintáctico y semántico, y puede basarse en uno o varios

aspectos de cada nivel de análisis. Es, precisamente, el grado de distanciamiento en estos

niveles de análisis, sus aspectos específicos y fenómenos peculiares lo que nos conlleva a

conceptos tales como lengua, dialecto, habla, e idiolecto. Esta variación lingüística

resulta fascinante no sólo para los estudiosos de la lengua española, sino también para

incluso cualquier persona, quien se muestra curiosa o sorprendida al escuchar o participar

en conversaciones entre hispanohablantes de diferentes países o zonas dialectales debido

a las diferencias que observa.

Estos temas de variación y cambio lingüístico han sido de gran interés para la

sociolingüística, la cual a través de una perspectiva variacionista, tiene como objetivo

describir, analizar y explicar la variación y el cambio, sus causas y efectos en relación

con variables internas (lingüísticas) y externas (sociales). En general, y teniendo los

trabajos de Labov (1966, 1972) y Trudgill (1974) de la lengua inglesa, los

1
estudios más abundantes desde esta perspectiva han sido de corte fonético-fonológico,

seguidos de estudios morfosintácticos y demás. Las variables sociales más utilizadas han

sido género, edad y clase social. En español, son innumerables los estudios variacionistas

que han contribuido a entender mejor el sistema y sus cambios. Sin embargo, los temas,

fenómenos, métodos y sujetos son tantos y diferentes que hacen necesaria la

investigación desde diferentes ángulos.

A este respecto, y siendo el nivel fonético-fonológico una fuente inagotable para la

investigación, un fenómeno variable frecuentemente aludido en los libros de fonética y

fonología española y en estudios dialectales es la producción de hiatos. No obstante su

mención constante en estos materiales, su estudio desde una perspectiva variacionista no

ha sido abordado en la misma medida. Por ello, realizar investigación sobre este tema se

vuelve relevante, pues no es suficiente con citar ejemplos de aquí y de allá donde los

hiatos se realizan de manera diferente. Es decir, necesitamos saber si efectivamente el

fenómeno presenta variación y ante qué variación nos enfrentamos.

Antes de presentar el objetivo de esta investigación, conviene aclarar algunas ideas y

conceptos sobre este fenómeno. En primer lugar, entendemos hiato como una secuencia

de vocales heterosilábicas adyacentes; es decir, de vocales que corresponden a sílabas

diferentes, ya sea en el interior de la palabra o en los lindes entre palabras. Ejemplos del

primer caso son rí-o; re-al; i-de-al; pa-se-ar; del segundo tipo, mi- a-m-igo; te-aviso; lo-

he comprado; qué-hubo. Con respecto a este tema, en su libro de pronunciación del

español, Navarro Tomás (1966), por ejemplo, señala que “la pronunciación vulgar”

reduce las vocales heterosilábicas a una sola sílaba. El mismo autor remarca que “[…] En

la América española este uso se halla más o menos desarrollado, aun entre las personas

2
instruídas” (p. 67). Por su parte, Quilis (1993) subraya que en el habla no culta se observa

una serie de fenómenos que afectan las secuencias vocálicas. Quilis enfatiza que en

español hay una “tendencia antihiática” que previene la aparición de hiatos. De lo

anterior, se asume que la realización de hiatos en español está asociada con variables

como habla culta, habla vulgar, personas instruidas o no instruidas, español de América,

español peninsular; lo cual indica que estamos ante un fenómeno condicionado por

variables externas.

Este fenómeno de hiatos, sin embargo, no es privativo de la lengua española; según

Casali (1997), muchas lenguas son intolerantes a los hiatos, como las lenguas africanas

Chichewa, Daga, Okpe y Emi, entre otras. El turco, reporta Kabak (2007), es una lengua

que también usa diferentes recursos cuando hay hiatos implicados. Chitoran y Hualde

(2007), por otra parte, subrayan que el francés es una de las lenguas romances con menor

producción de hiatos. No obstante, a pesar de ser un fenómeno general en muchas

lenguas, las formas de enfrentarse a los hiatos varían según la lengua o el dialecto, y otras

condicionantes lingüísticas y sociales. Recientemente, Jenkins (1999) y Alba (2006)

estudiaron el caso del español de Nuevo México; Vuskovich (2006), el español

mexicano; Garrido (2007), el colombiano; Hualde & Prieto (2002); Face & Alvord

(2004), Aguilar (2006) y Hualde et al (2008), el español peninsular; Martínez-Gil (2000)

y Morris (1998), el español chicano y el peninsular, y sus resultados varían no sólo de un

dialecto a otro, sino dentro de un mismo dialecto. De esta manera, el fenómeno de

producción de hiatos muestra una variación compleja que requiere de su estudio en

diversos dialectos atendiendo variables lingüísticas y sociales diversas, que ayuden a

caracterizar y explicar mejor dicha variación.

3
En español mexicano, en particular, es muy frecuente escuchar ‘teatro’ como [te.a.tɾo] o

[tja.tɾo] y palabras como ‘alcohol’, ‘leer’ y ‘paseé’ se escuchan a menudo con la

secuencia vocálica reducida a un solo segmento, o con ambas vocales en sílabas

diferentes. Un caso característico de vocoides contiguos en este dialecto parece ser la

secuencia de vocal media anterior más otra vocal no alta [e]V, pues ésta es fuente de una

notable variación en el habla. Palabras de diferente categoría gramatical -verbos,

adjetivos, sustantivos, por ejemplo ‘peón’, ‘mear’, ‘león’, ‘teatro’, ‘real’, ‘pateó’,

‘volteé’, ‘golpeado’, entre muchas otras- muestran diversas formas de pronunciación

entre los hablantes. La tendencia general que se observa en muchas palabras con esta

combinación [e]V es evitar el hiato; es decir, se evade que las dos vocales aparezcan

contiguas en sílabas distintas. No obstante, esto no siempre es así; hay palabras como

‘leo’, ‘sea’, ‘video’, ‘empleo’, ‘feo/a’, por ejemplo, cuyos grupos vocálicos parecen no

ser alterados y las vocales se mantienen en su respectiva sílaba.

Para lidiar con los hiatos, entonces, los hablantes se valen de diferentes mecanismos o

estrategias de resolución de hiatos, como Casali (1996) las llama. El conjunto de

estrategias usadas por los hablantes también es variable y puede incluir desde la retención

o mantenimiento del hiato, pasando por la diptongación, o la fusión de vocales, u otra

estrategia hasta la elisión de una vocal1. Por tanto, en algunos dialectos o en algunos

grupos de hablantes, se da una preferencia o una tendencia a favorecer una u otra

estrategia, lo cual conlleva resultados diferentes que propician la variación existente.

1
En el capítulo dos se describirán con detalle dichas estrategias.

4
El fenómeno variable de la resolución de hiatos en español mexicano es tan extenso que

se evidencia incluso en la escritura, donde la ortografía normativa se modifica para

acomodar los cambios de pronunciación que se producen con el uso de determinada

estrategia. Así, es común encontrar en textos en internet, chats, novelas, cuentos, o

cualquier texto escrito que trate de reproducir la lengua oral vernácula, ejemplos de

palabras en los que se observa la resolución de hiatos por medio de diversas estrategias:

‘pelió’ (peleó), ‘maiz’ (maíz), ‘raiz’ (raíz), ‘voltié’ (volteé), ‘mojo’ (moho), ‘alcol’

(alcohol), etc.

El problema que conlleva este fenómeno -se presupone-, es que al disponer de varias

estrategias, los hablantes de un dialecto u otro, de un grupo u otro, o incluso sujetos de

manera individual pueden recurrir a cualquiera de ellas y la variación, por ende, puede

resultar heterogénea y arbitraria. Por tanto, indagar sobre los factores que condicionan

esta variación y descubrir sus posibles pautas se convierte en una necesidad imperiosa

para la comprensión y explicación del fenómeno variable de la resolución de hiatos. De

esta manera, el presente estudio sociofonético tiene como objetivo específico identificar

las estrategias usadas para resolver los hiatos en los verbos –ear en español mexicano y

analizar los factores internos y externos que condicionan dichas estrategias. A partir de

estos resultados, podremos analizar el tipo de variación observada y sus patrones.

Para ello, partimos de la hipótesis de que la variación en la resolución de hiatos no es

arbitraria; más bien parece estar condicionada por diversos factores de diferente orden:

lingüísticos, sociales, dialectales y estilísticos. Entre los factores lingüísticos, en la

literatura se reportan en general: tipo de sílaba, posición de las vocales, el acento, el tipo

de morfemas implicados, el contenido léxico, restricciones sintácticas, la calidad de las

5
vocales, el grado de sonoridad de las vocales y el efecto léxico. Dado que el mismo

objetivo del presente estudio delimita ya algunos factores internos al tratarse de hiatos al

interior de palabras, y específicamente de verbos –ear, los factores internos en los que

nos enfocaremos son: la calidad de la vocal siguiente, el acento, el tipo de sílaba y el

grado de sonoridad de la secuencia. Las hipótesis que se postulan son las siguientes:

1. La formación de diptongo es la resolución de hiato más utilizada en los verbos –

ear en español mexicano.

2. En el caso de vocales idénticas en contacto en los verbos –ear, no ocurre que una

se elida; sino que formará diptongo.

3. El acento es la principal condicionante lingüística que inhibe la formación de

diptongos, ya que las vocales que reciben acento son más resistentes a los

cambios.

4. En español mexicano hay una tendencia a evitar secuencias vocálicas con

sonoridad constante; es decir, se prefiere una secuencia vocálica cuyos elementos

se distingan lo más posible en cuanto a sonoridad.

5. La traslación acentual en español mexicano no es favorecida.

6. Las sílabas cerradas desfavorecen el mantenimiento del hiato.

Con respecto a los factores sociales, se incluirán en este estudio el sexo, la edad y el nivel

de escolaridad con el fin de identificar asociaciones de las estrategias de resolución de

hiatos con uno o varios grupos sociales y entender así el tipo de variación observada. Las

hipótesis que se proponen son:

6
1. Los grupos más jóvenes favorecen la resolución del hiato con estrategias

diferentes a la heterosilabificación.

2. Las personas con nivel educativo alto favorecen la deslizada media [], mientras

que aquéllas con un nivel bajo favorecen la deslizada alta [j].

3. La entrevista favorece la resolución de hiatos con estrategias diferentes al

mantenimiento del mismo.

Con el fin de comprobar o rechazar las hipótesis planteadas, este estudio intenta conjuntar

la teoría y metodología variacionista con un enfoque fonético experimental esperando así

obtener suficientes datos y ofrecer resultados más objetivos y confiables que resulten una

fuente útil para el desarrollo de representaciones fonológicas o estudios teóricos de temas

relacionados con la sílaba, las vocales y deslizadas, el acento, así como para la

descripción más real del fenómeno de resolución de hiatos en estudios dialectales.

1.1 Panorama general

El presente estudio se divide en cinco capítulos. El capítulo dos ofrece una revisión de la

literatura y un marco teórico sobre el fenómeno de la resolución de hiatos. En éste se

discuten los trabajos previos sobre el tema y la problemática en general tratando de

dilucidar los factores internos y externos condicionantes de la resolución de hiatos en

español, así como las características fonéticas de las diferentes estrategias. Se discuten

particularmente las estrategias usadas en español para resolver los hiatos y la variación

que se observa al respecto. Además, con el objeto de comprender mejor el fenómeno en

cuestión, se abordan conceptos, nociones y teorías relacionados con la producción de

hiatos, como son la estructura silábica, la escala de sonoridad y el acento.

7
El tercer capítulo presenta la metodología que se implementó para este estudio. Aquí se

detalla la metodología y teoría variacionista, así como su complementariedad con un

enfoque fonético experimental y se justifica su uso para este estudio. Los sujetos,

población y muestra se describen también junto con los respectivos procedimientos de

selección. A continuación, se especifican los instrumentos y procedimientos para la

recolección y análisis de los datos, los cuales -en consonancia con la metodología

variacionista y el enfoque fonético experimental- incluyen una entrevista sociolingüística

y dos pruebas fonéticas, así como análisis estadísticos y acústicos. Finalmente, el

contexto variable y las hipótesis se definen en este capítulo también.

Los resultados de los análisis acústicos se presentan y discuten en el capítulo cuatro.

Éstos se componen de las observaciones obtenidas en las entrevistas y las pruebas

fonéticas. Estos análisis fueron indispensables para definir la variante utilizada (estrategia

usada) y conformar el corpus que se utilizó en el análisis estadístico. Presentamos aquí

algunos hallazgos de carácter acústico que nos permitieron identificar y clasificar las

estrategias. Por ejemplo, se discute el papel de la duración, la velocidad y pendiente de la

transición, los valores de F1 y F2 y su relevancia. Además, los resultados aquí obtenidos

se analizan en relación con los hallazgos, conceptos y teorías revisados en el capítulo dos.

La segunda parte del capítulo cuatro integra los resultados e interpretación del análisis

estadístico para el cual se incluyen las variables lingüísticas y sociales. Por medio de

tablas y gráficas se ilustra la relación y función de las variables internas y externas en

relación con las estrategias de resolución de hiato en los verbos –ear. Al igual que en la

primera parte del capítulo, los resultados encontrados se analizan e interpretan en

términos de los conceptos y teoría revisados en el capítulo dos y se validan o rechazan las

8
hipótesis aquí postuladas. Al final del capítulo de analiza el tipo de variación de este

fenómeno en la comunidad de habla identificando sus patrones y tendencias.

Finalmente, en el capítulo cinco se presentan las conclusiones a las que se llegaron con

esta investigación y se sugieren direcciones para futuras investigaciones sobre el tema de

resolución de hiato en español.

9
Capítulo 2: Revisión de la literatura y marco teórico

2.1 Resolución de hiato en español

Entendemos como hiato una secuencia de vocales heterosilábicas adyacentes, que puede

encontrarse en los lindes silábicos dentro de una palabra (nivel léxico) o entre dos

palabras (nivel postléxico). Es decir, estas vocales pertenecen a sílabas contiguas y se

pronuncian en sílabas diferentes. De acuerdo con el Diccionario panhispánico de dudas

y otras gramáticas tradicionales, la silabificación de secuencias vocálicas en el nivel

léxico es bastante predecible, ya que se produce un hiato en los siguientes contextos:

Combinaciones de vocal media o baja átona (a,e,o) y vocal alta tónica (i, u):

1) raíz [ra.ís] oír [o.íɾ] ataúd [a.ta.úđ]

Combinaciones de vocal alta tónica (i, u) y vocal media o baja átona (a,e,o):

2) frío [fɾí.o] búho [bú.o] María [ma.ɾí.a]

Combinaciones de vocales idénticas:

3) poseer [po.se.éɾ] alcohol [al.ko.ól] azahar [a.sa.áɾ]

Combinaciones de dos vocales medias o una media con una baja:

4) teatro [te.á.tɾo] poeta [po.é.ta] etéreo [e.té. ɾe.o]

10
Casali (1996) señala que muchas lenguas son intolerantes al hiato, y la lengua española

parece ser una de ellas. Ante la presencia de hiatos, las lenguas se apoyan de diversas

estrategias para resolver (sortear) la secuencia vocálica. Casali llama resolución de hiato

al uso de cualquier estrategia de las que se valen los hablantes para enfrentar los grupos

vocálicos heterosilábicos. Dichas estrategias, de acuerdo con el mismo autor, pueden ser:

heterosilabificación, diptongación, epéntesis consonántica, elisión, formación de

deslizada y fusión. A continuación se describe cada una de ellas con ejemplos en español

en el nivel léxico, siempre que sea posible:

• Heterosilabificación: CV1 + V2 > .CV1. V2

Esta estrategia implica mantener las vocales en sílabas diferentes; es decir, es el

mantenimiento del hiato.

5) teatro [te.á.tɾo] río [rí.o] aún [a.ún]

• Diptongación: CV1 + V2 > . CV1 V2

Las vocales de la secuencia se silabifican en el núcleo de una sola sílaba. Logjenga

(1994), citado en Casali (1996), ilustra esta estrategia en Ngiti, una lengua africana

donde ocurre diptongación:

6)

izo ɔku ‘caña de azúcar’  [.i.zoɔ .ku]

Ngbangba ɔdzɔ ‘enano’  [.ngba.ngbaɔ .dzɔ]

Clark et al. (2007) señalan que cuando en la producción de vocales hay un ligero

movimiento articulatorio que resulta en un cambio en la calidad auditiva, ya sea antes o

después de la vocal objetivo, tenemos una onglide (cuando la deslizada antecede a la

11
vocal) y una offglide (cuando la deslizada procede a la vocal) y usan subíndices o

superíndices, respectivamente, para distinguirlas en la transcripción fonética. Sin

embargo, estos autores distinguen este fenómeno con deslizadas de los diptongos porque

en los primeros hay sólo un valor objetivo de la vocal, mientras que en los segundos hay

dos objetivos vocálicos y su movimiento articulatorio ocupa una parte considerable del

diptongo. En la transcripción usan dos dígrafos en el mismo nivel. En español, éstos son

los diptongos que se observan. En Ngiti, los ejemplos de arriba parecen corresponderse

con las onglides y offglides que sugieren Clark et al (2007).

• Epéntesis consonántica: CV1 + V2 >.CV1. CV2.

Inserción de una consonante en medio del grupo de vocales en contacto.

Sanicky (1989) encontró ejemplos de epéntesis de una oclusiva glotal en Misiones,

Argentina:

7) paraíso [pa. ɾa.ʔí.so] reúno [re.ʔú.no]

Garrido (2007) ilustra esta estrategia en español colombiano con:

8) canoa [ca.no. ɣa]

En español mexicano podemos escuchar:

9) creía [kɾe. í βa] traía [tra.í. βa] moho [mo.xo]

• Elisión: CV1 + V2 >.CV2 (:). Ó CV1(:) .

Una de las vocales se elide. En algunas lenguas puede suceder un alargamiento

vocálico, sobre todo si se trata de la misma vocal.

12
10) lee [le] leerás [le.ɾás] alcohol [al.kol]

• Fusión: CV1 + V2 > .CV3 (:).

Una secuencia de vocales V1 + V2 se realiza como una tercera vocal, la cual comparte

algunos rasgos con el par de vocales originales. Jenkins (1999) reporta el siguiente

ejemplo, pero éste a nivel postléxico (entre palabras) con múltiples variantes:

11) [no.me.a.kweɾ. ðo]  [no.mæ. kweɾ. ðo]

[no.mɑ. kweɾ. ðo]

[no.mɛ. kweɾ. ðo]

[no.mo. kweɾ. ðo]

[no.mə. kweɾ. ðo]

• Formación de deslizada: CV1 + V2 > .CGV2(:).

Según Casali (1996), las vocales se pronuncian en la misma sílaba, pero la primera

vocal emerge en la superficie como deslizada. En español, la resolución de hiatos con

formación de deslizada no sólo se realiza en la primera vocal, sino que también puede

haber deslizamiento de la segunda vocal. Ejemplos del primer caso son los siguientes:

12) teatro [te.á.tɾo]  [tjá. tɾo] aéreo [a.é.reo]  [a.é.rjo]

almohada [al.mo.a.ða]  [al. mwa.ða]

13
Ejemplos del segundo tipo:

13) país [pa.ís]  [pá i̯ s] maíz [ma. ís]  [mái̯s]

cae [ká.e]  [kái̯]

En el primer caso, suponemos que tras la diptongación, hay un cambio en el timbre de la

deslizada al elevarse a alta. En el segundo caso, en el caso concreto de “país” y “maíz”, la

resolución del hiato a través de la formación de deslizada se efectúa acompañado de

desplazamiento acentual y es la segunda vocal la que se desliza. Adelante se describirán

con detalle estos fenómenos que coadyuvan a la resolución de hiato en español. Mientras

tanto, cabe aclarar que, dadas estas particularidades de la lengua española, que difieren un

poco de la propuesta de Casali (1996), en el presente trabajo se utilizará el término

diptongación para referirnos a la estrategia de resolución de hiato que conlleva

necesariamente formación de deslizada, ya sea de V1 o V2 y cuya secuencia muestra dos

objetivos vocálicos.

Por cuestiones de claridad, resulta conveniente describir los diptongos en español. En

breve, éstos se entienden como la pronunciación de una secuencia de dos vocoides

adyacentes en una sílaba. Siguiendo la gramática tradicional, un diptongo ocurre:

Si la secuencia vocálica incluye una vocal media o baja tónica (a,e,o) y una vocal alta

átona (i,u):

14) laico [láj.ko] piano [pjá.no] viejo [bjé.xo]

Face y Alvord (2004) añaden un caso más de diptongo:

14
Si tenemos dos vocales altas (y conviene agregar que deben ser átonas), la primera se

deslizará:

15) ciudad [sju.đáđ] cuidado [kwi.đá.đo]

Esta regla aplica, por supuesto, a los diptongos “naturales” y a los que resultan cuando se

usa la diptongación para resolver un hiato. Como se observa en esta descripción, las

vocales altas son las que se realizan como deslizadas en la superficie al diptongar la

secuencia vocálica. Con esto, se entiende que las deslizadas en español no tienen un valor

fonémico, pues sólo emergen en la superficie en estos contextos de contacto y

diptongación. Hay, sin embargo, un gran debate actualmente sobre la naturaleza fonémica

de las deslizadas en la lengua española. En la sección 2.4 retomamos este tema sobre

vocales y deslizadas y ofrecemos una discusión al respecto.

Tradicionalmente en la lingüística hispánica se le llama semiconsonantes a los vocoides

altos que resultan de una diptongación de una secuencia vocálica en las que ellos ocupan

la primera posición; es decir, ellos son la V1 previamente a la diptongación. Ya que

prescriptivamente en español sólo las vocales altas [i, u] pueden deslizarse, tenemos sólo

los siguientes símbolos fonéticos para las semiconsonantes: [j, w]. Por otra parte, se les

llama semivocales a los vocoides altos que ocupan la segunda posición en la secuencia y

que se deslizan como efecto de la diptongación. Los símbolos que generalmente se

utilizan para representarlos fonéticamente son: [i̯ , u̯]. Como puede observarse en los

ejemplos del inciso 12, los diptongos del primer caso forman semiconsonantes y en los

del inciso 13, semivocales. Para efectos de este estudio, se usará el término deslizada para

referirse a ambas semiconsonantes y semivocales, siempre y cuando no sea necesaria la

distinción.

15
Matluck (1995) distingue entre diptongación “estándar” y diptongación “no estándar”. La

primera se refiere a los diptongos que resultan de la unión de dos vocales distintas en una

sílaba, siendo una de ellas alta y átona. Ésta cambia su forma fonética de vocal a

semiconsonante [j], [w] o semivocal [i ̯], [u̯], y pierde su nuclearidad. Por ejemplo:

[pjén.so], [sjés.ta] , [ói ̯.ɣo], [páu̯.sa].

La diptongación “no estándar”, por otra parte, ocurre cuando en una secuencia de vocales

diferentes una de ellas es una vocal media /e/ u /o/, y ésta se realiza como deslizada tal

como la hace una vocal alta. Es decir, hay un cambio de timbre y un deslizamiento que

resulta en [j] o [w]. Ejemplos de esta diptongación no estándar son /pe.ór/  [pjor];

/é.ro.e/  [é.rwe]. Los ejemplos del inciso 12 muestran este tipo de diptongación “no

estándar” al que Matluck se refiere.

Como se ha visto hasta aquí, aunque la formación de hiatos en la lengua española es

bastante predecible, los hablantes se valen de un conjunto de estrategias y recursos

fonológicos para evadir dichos hiatos; y los resultados pueden ser diversos dependiendo

del uso de unos u otros. La Real Academia Española y la literatura sobre resolución de

hiatos admiten que en algunos dialectos se evitan los hiatos y que hay variación con

respecto a las estrategias y condicionantes lingüísticas para dicha resolución. Esto se ha

observado tanto en el nivel léxico como en el postléxico (véase Henríquez Ureña, 1938,

1976; Matluck, 1951; Navarro Tomás, 1966; Lope Blanch, 1972, 1983. 1996;

Perissinoto, 1975; Suárez,1980; Canfield, 1981; García Fajardo, 1984; Williamson, 1986;

Ávila, 1990; Quilis, 1993; Moreno de Alba, 1994; Lipski , 2006; Morris, 1998; Aguilar,

16
1999; Martínez-Gil, 2000; Jenkins, 1999; Hualde y Prieto, 2002; Vuskovich, 2006; Alba,

2005, 2006; Garrido, 2007; Chitoran y Hualde, 2007).

La pregunta obligatoria entonces es cómo está condicionada dicha variación. La

investigación más reciente al respecto, de hecho, ha tenido como objetivo describir esta

variación existente y desde diferentes perspectivas se ha confirmado la presencia de

factores dialectales, lingüísticos, estilísticos y sociales que condicionan el uso de las

estrategias de resolución de hiatos en español. En las siguientes páginas abordamos este

fenómeno de variación de la resolución de hiatos con algunos de los hallazgos más

relevantes.

2.2. Variación en la resolución de hiatos en español

El fenómeno de la resolución de hiatos ha sido investigado desde diferentes perspectivas

teóricas, distintas metodologías, y en varios dialectos. Así, analizando las descripciones o

hallazgos, se ha podido identificar variación en las estrategias usadas. Los estudiosos del

fenómeno se han dado a la tarea también de describir las condicionantes o restricciones

que rigen el uso de una u otra estrategia. Estas constricciones se clasifican en general en

factores externos (sociales, dialecto, estilo) e internos (lingüístico-estructurales). En esta

sección revisaremos algunos de estos factores que han sido descritos en la literatura.

2.2.1 Variación y factores externos

En español, la diptongación ha sido una estrategia común documentada en la resolución

de hiatos. Esta estrategia, como previamente se señaló, implica la formación de

deslizadas [j, w] teniendo como fuente las vocales altas /i, u/ o las vocales medias /e, o/;

17
éstas últimas cambian en algún punto de timbre para poder llegar a ser deslizadas altas.

Otros ejemplos son: /pe.rí.o.đo/  [pe.rjó.đo]; /gi.ó/  [gjo]; /pe.le.ó/  [pe.ljó];

/gol.pe.ár/  [gol.pjar].

María Vaquero (1996) en las Antillas; Lope Blanch (1996, 2000) en México; Quesada

Pacheco (1996) en Centro América; Sedano & Bentivoglio (1996) en Venezuela; Montes

(1996) y Garrido (2007) en algunas regiones de Colombia; Sanicky (1989) en Argentina;

y Lipski (2004) en Costa Rica han identificado esta estrategia como una de las más

comunes en la resolución de hiatos. Hualde y Prieto (2002), Hualde et al (2008), y

Aguilar (2005, 2006) reportan esta estrategia en España.

Aunque la diptongación parece ser una estrategia predominante en la resolución de hiatos

en el mundo de habla hispana, Frago-Gracia y Franco-Figuera (2001) declaran que esta

estrategia es una característica general sólo del español de América. A su vez, Hualde

(2005) sostiene que los dialectos en Latino América favorecen la diptongación más que el

español peninsular en estilo formal. No obstante, se ha reportado Bolivia como un país

donde se conservan los hiatos (Coello Vila, 1996). Aparentemente resulta, entonces, que

la variación con respecto del mantenimiento o no del hiato depende del dialecto en

cuestión.

Siguiendo con diferencias dialectales, NavarroTomás (1990) señala que cuando dos

vocoides altos pertenecen a la misma sílaba, el primero es el que se desliza en la mayoría

de los dialectos. Por ejemplo, [kwi. ða] y [sju. ðað]. Sin embargo, en otros dialectos

puede ocurrir lo contrario; el segundo vocoide es el que se hace deslizada: [kuj. ða] y

[siw. ðað]. Alarcos Llorach (1971) subraya que esta variación no es tan sólo dialectal,

18
sino también intra-hablante; es decir, que el mismo hablante algunas veces hace deslizada

el primer vocoide y otras veces, el segundo.

La velocidad de habla y el estilo han sido consideradas como otras variables en la

resolución de hiatos (D’Introno et al., 1995; Hualde et al., 2001; Alba, 2005, Martínez-

Gil, 2000). Con respecto a velocidad, Jenkins (1999) sostiene que “[…] Hiatus clusters

are affected a great deal by rate of speech, with andante speech rendering high numbers

of heterosyllabication”2 (p.13). Morris (1998), investigando el español chicano, el

mexicano y el peninsular, encontró que a mayor velocidad en el habla, mayor es la

tendencia a resolver el hiato con diptongación o con elisión.

Por su parte, Garrido (2007) comparó dos dialectos regionales del español colombiano y

demostró que, al usar dos tareas diferentes para motivar los estilos formal e informal, se

presentan claras diferencias en la resolución de hiato, pues en un estilo formal o cuidado

se favorece el mantenimiento del hiato. Ella utilizó una lista de palabras para elicitar el

estilo formal y una narración para el estilo informal.

En cuanto a factores sociales, de manera recurrente en la literatura se ha asociado el uso

de estrategias para evadir los hiatos con gente inculta o de clase socioeconómica baja

(Navarro Tomás, 1990; Matluck, 1995; Barrutia y Schwegler, 1994), o con gente rústica

u originaria de áreas rurales. Esta atribución se ha reportado en Puerto Rico por Álvarez

Nazario (1990); Moreno de Alba (1994) lo ha hecho en México; y Flórez (1951) en

Colombia. Asimismo, Alarcos Llorach (1995), en la Gramática del español, afirma que

2
Harris (1969) distinguió cuatro diferentes tipos de velocidad de habla en el dialecto de la Ciudad de
México. Esto son: Largo (lento y muy preciso); Andante (no tan lento y típico del habla cuidada);
Allegretto (más rápido y típico del habla casual; y Presto (extremadamente rápido y sin ningún tipo de
monitoreo).

19
los diptongos derivados de una secuencia vocálica que originalmente formaba hiato son

coloquiales y vulgares. De esta manera, se observa que el nivel educativo o las

dicotomías rural vs. urbano, vulgar vs. estándar se han tratado como factores

condicionantes del fenómeno de resolución de hiatos. Dado que en la presente

investigación se considerarán variables sociales, a continuación resumimos algunos

estudios que han incorporado este tipo de variables en la investigación sobre hiatos.

Perissinotto (1975) estudió la producción de hiatos en la ciudad de México considerando

edad, género y estatus socioeconómico como variables sociales y limitando su análisis a

los grupos vocálicos /ea/, /oa/ y /oe/ a nivel léxico (secuencias dentro de la palabra). Sus

resultados demuestran que 72.1% de los informantes evitan los hiatos utilizando

principalmente la diptongación como estrategia de resolución; los hombres resuelven los

hiatos un 82.7% de todos los casos posibles, mientras que las mujeres lo hacen un 65.3%;

la edad no resultó ser una variable significativa; y en cuanto al estatus socioeconómico,

los grupos de clase baja y media produjeron relativamente igual porcentaje de casos de

resolución de hiato (evasión del hiato): 75.7% and 77.5%, respectivamente. La clase alta

evitó los hiatos en un 64.5%. Perisinotto destaca que es sólo en la clase alta donde

predomina el hiato como norma.

Sanicky (1989) llevó a cabo un estudio en Misiones, Argentina donde entrevistó a 129

informantes. Su propósito fue identificar las estrategias de resolución de hiato y su

frecuencia según los dialectos regionales de Misiones. Para ello, analizó secuencias

vocálicas tanto en el nivel léxico como en el postléxico; y usó el nivel cultural (basado en

ocupación, nivel educativo y redes sociales) y la edad como variables externas. Entre sus

hallazgos tenemos que heterosilabificación, epéntesis consonántica, alargamiento

20
vocálico, diptongación y elisión fueron las estrategias más recurrentes. Además, encontró

que a mayor cercanía geográfica con Paraguay, mayor tendencia al uso de la epéntesis

consonántica (oclusiva glotal), pues, explica la autora, que se trata de influencia del

guaraní. En las regiones orientales cercanas a Brasil, se nota una preferencia por la

heterosilabificación, aunque la diptongación es la más usada por todos los dialectos.

Sanicky reportó que los hablantes mayores de 40 años y los que pertenecen a niveles

culturales bajos favorecen la estrategia de epéntesis consonántica más que la

heterosilabificación o la diptongación.

En el dialecto mexicano, Moreno de Alba (1994) reporta que en el Atlas Lingüístico de

México (Lope Blanch 1990) la diptongación de /e/ átona seguida de vocal fuerte en

interior de palabra es un fenómeno que “no parece privativo de determinado nivel

sociocultural, sino que prácticamente se da por igual en hablantes analfabetas que de

cultura media” (p. 52). No obstante, señala que en los lugares en que la diptongación no

es tan frecuente, ésta es más característica de hablantes de bajo nivel social. También,

agrega, que este tipo de diptongación se produce con mayor frecuencia en áreas rurales.

Manteniendo el mismo contexto fonético, pero pasándolo al nivel de lindes de palabras,

el mismo Moreno de Alba resalta que la diptongación en este caso es característica de

hablantes de niveles socioculturales bajos y de zonas rurales más que de hablas urbanas.

En un estudio interdialectal, Matluck (1995) investigó las actitudes de los hablantes hacia

la aceptabilidad social de la resolución de hiatos (eliminación) en el nivel postléxico. Su

muestra consistió de cinco grupos de 10 personas del habla culta de cinco capitales de

países hispanohablantes: Buenos Aires, Argentina; La Paz, Bolivia; La Habana, Cuba;

ciudad de México; y Caracas, Venezuela. Los resultados demuestran que 46%

21
mantuvieron el hiato, mientras que el resto optó por alguna estrategia de eliminación del

hiato. Esto sugiere que la intolerancia hacia el hiato en Latinoamérica es un fenómeno

que permea en todos los grupos sociales, incluidos los del habla culta.

Vuskovich (2006) estudió la resolución de hiatos en la ciudad de México desde una

perspectiva sociolingüística considerando la edad y el género como variables externas, y

los grupos vocálicos /a + e/, /e + a/, /o + a/ y /o + e/ en el nivel postléxico. El autor

encontró que la mayoría de estos grupos permanecen heterosilábicos, es decir, el hiato se

mantiene. Sin embargo, cuando la resolución se efectúa, se recurre principalmente a las

siguientes estrategias con la frecuencia correspondiente al orden de aparición: 1)

formación de deslizada de vocal no alta3 V1, 2) formación de deslizada de vocal no alta

V2, 3) elisión de V1, 4) elisión de V2 y 5) formación de deslizada alta de V1. En cuanto a

las variables sociales, se encontró que el uso de las estrategias varía dependiendo del

género, ya que las mujeres tienden a elidir más la V1 y los hombres, la V2. Además, las

mujeres usan en menor medida la formación de deslizada no alta de la V2 que los

hombres. Otro resultado interesante es que entre los grupos etarios considerados, el de las

personas mayores produjo más hiatos que los otros grupos más jóvenes. Otro hallazgo fue

que los mayores no recurrieron a la estrategia de elisión, mientras que los jóvenes la

usaron considerablemente.

Un caso especial y relacionado con la variación de la resolución de hiatos es la

hipercorrección. Aunque en la literatura no se encuentran ejemplos de este fenómeno, es

3
En la presente tesis la llamo deslizada media porque las secuencias implicadas no incluyen la vocal baja
en primera posición; es decir, es siempre un vocoide medio el que aparece en primera posición y el que se
desliza manteniendo el mismo timbre vocálico o cambiándolo a alta. De ahí la distinción entre deslizada
alta y media.

22
conveniente señalar que en español mexicano se puede observar el uso de las desinencias

de los verbos –ear para los verbos –iar, con mantenimiento del hiato. Por ejemplo,

algunos dicen “No me copees” en vez de “No me copies’’ o “Ya lo vaceé” por “Ya lo

vacié”, o “Negocear” por “Negociar”. Sugerimos que son casos de hipercorrección

porque, al parecer, los hablantes confunden las reglas normativas y las de uso y para

“evitar” caer en errores extrapolan las reglas para los verbos –ear a los verbos –iar

reteniendo los hiatos implicados. Cabe agregar que generalmente se escuchan estas

formas hipercorrectas en personas de distinto nivel social.

Lo que parece ocurrir es que, dado que una estrategia frecuente para resolver el hiato en

los verbos –ear es la diptongación con elevación de la vocal media teniendo como

resultado [j] + V (ejemplo [pa.tjé]), algunos hablantes que intentan apegarse a la norma

prescrita y que conscientemente saben que la diptongación como estrategia de resolución

no es la forma estándar, evaden el resultado de deslizada más vocal en todas las formas

verbales que producen dicha secuencia. Consecuentemente, ya que las conjugaciones de

los verbos –iar implican la combinación [j] + V (ejemplo [ko.pjé]), estos hablantes

“hipercorrectos” aplican las reglas de conjugación de los verbos –ear que

normativamente prescriben el mantenimiento de los hiatos.

2.2.2 Variación y factores internos

A diferencia del limitado número de estudios que han integrado variables sociales para

abordar la resolución de hiatos, varios lingüistas se han dedicado al estudio de la

variación de este fenómeno desde un enfoque meramente lingüístico, analizando sólo

variables internas. (Ver, por ejemplo, Morgan, 1984; Rosenthall, 1994; Méndez, 1998;

23
Senturia, 1998; Jenkins, 1999; Martínez-Gil, 2000; Hualde y Prieto , 2002; Face &

Alvord, 2004; Aguilar, 2005 and 2006; Alba, 2005; Bakovic, 2007; Chitoran & Hualde,

2007; Hualde et al., 2008). Así, a partir de intuiciones y de un dialecto en particular, este

tipo de investigaciones ha ofrecido valiosas descripciones y explicaciones de la variedad

de las estrategias y los usos de las mismas dependiendo de restricciones lingüísticas que

se han identificado. Especial énfasis se ha hecho en la descripción de estas restricciones

que influyen la selección de una u otra estrategia para resolver los hiatos y que,

precisamente, conllevan a la variación existente en diferentes dialectos o idiolectos.

Abajo discutiremos algunas de estas restricciones identificadas y que dan pie a diferentes

formas de resolver los hiatos y, por ende, a la variación de este fenómeno.

Bakovic (2007), por ejemplo, afirma que una diferencia entre el español chicano y otras

variedades es que:

[ ] the otherwise expected stress on the vowels involved is irrelevant to the hiatus
resolution strategy employed; if either vowel would otherwise be stressed, then
the resulting vowel is stressed; otherwise, it is unstressed. In other Spanish
varieties, the otherwise expected stress pattern directly influences the choice of
hiatus resolution strategy (or even whether there is one) (p. 1).

El autor reporta las siguientes estrategias en español chicano:

Coalescence (o elisión en otros análisis) de vocales idénticas.

a. lo odio [lo.ðjo] b. mi hijo [mixo]

Elisión de vocales bajas (antes de cualquier vocal inicial).

a. la iglesia [liɣlesja] b. paga Evita [paɣeβita]

24
Formación de deslizadas altas (diptongo de sonoridad creciente)

a. mi última [mjultima] b. mi hebra [mjeβɾa]

Formación de deslizadas medias (V1 es una vocal media y V2 difiere de ésta en altura o

anterioridad resultando en un diptongo de sonoridad creciente).

a. me urge [mjuɾxe] b. pague ocho [paɣjoʧo]

Fusión de vocales medias o altas

a. se hinca [siŋka] b. como uvitas [komuβitas]

Bakovic sugiere que en otras variedades del español las estrategias para resolver el hiato

son diferentes por la influencia del acento; es decir, en español chicano puede haber

traslación o dislocación del acento, mientras que en otros dialectos esto no es posible.

Morris (1998) y Martínez-Gil (2000) compararon la resolución del hiato en lindes de

palabras en los dialectos chicano, mexicano y peninsular. Los datos para el análisis se

tomaron de las intuiciones de hablantes nativos o de ejemplos comunes en la literatura

sobre dicho fenómeno. Morris (1998) abordó su estudio usando el marco de la Teoría de

la Optimidad e incluyó el estilo como variable. Encontró que en el español peninsular, la

resolución de hiatos está condicionada por la jerarquía o escala de sonoridad de las

vocales involucradas, incluso si esto significa la producción de deslizadas al inicio de

palabra. Por otra parte, en el español mexicano, la estrategia preferida - diptongación-

forma deslizadas en todos los casos, tanto altas como medias. De igual manera, en

25
español chicano la tendencia es resolver los hiatos con diptongación, pero en este dialecto

todas las deslizadas resultan altas, ya sea porque la vocal involucrada era alta

originalmente o porque las vocales medias se deslizan y después se produce una

elevación a alta.

Observando la función del acento en estos dialectos, Morris encuentra que en español

peninsular todas las vocales tónicas pueden formar diptongos en los lindes silábicos entre

palabras, lo cual significa que se pueden formar semiconsonantes o semivocales. La

forma que tomen los vocoides en cuestión dependerá de su grado de sonoridad en la

escala; es decir, el núcleo recién formado del diptongo debe constituir la cima de

sonoridad de la sílaba y el vocoide periférico de menor grado de sonoridad entonces se

conformará en una semiconsonante o semivocal. Esta condición, por tanto, es la que

posibilita la traslación acentual en este dialecto, ya que si la vocal tónica es la menos

sonora, entonces el acento será trasladado a la vocal más sonora. Morris (1998) cita

ejemplos de otras fuentes (Navarro Tomás, 1967; y Hualde, 1994):

la hija  l[áj]ja

de ambos  d[eá]mbos

menú antiguo  men[wá]ntiguo


acné inoportuno  acn[éj]nopurtuno

En español mexicano, por otra parte, una vocal tónica no puede deslizarse. Una

semivocal se deriva de una V2 si la V1 está acentuada, sin importar la escala de sonoridad.

Si la V2 recibe acento, entonces la V1 se desliza volviéndose semiconsonante. Por tanto,

en este dialecto el acento bloquea la formación de deslizadas, ya que la dislocación

acentual no es aceptable.

26
En español chicano, la diptongación conlleva siempre formación de semiconsonantes sin

importar la ubicación del acento o el nivel de sonoridad de las vocales en el grupo. Sin

embargo, si la última condición se requiriera, ésta se satisfaría pues el elemento no

nuclear en la secuencia es siempre una semiconsonante (deslizada ante vocal nuclear) y

ésta es de menor nivel de sonoridad que cualquier otra vocal, según las escalas propuestas

para español (Hualde, 1995). La traslación acentual se observa en este dialecto, pero la

dirección en cualquier caso es de la V1 a la V2: ‘Habl[wá]dán’.

El análisis de Bakovic (2007) coincide con el de Martínez-Gil (2002) en cuanto a la

tendencia en español chicano a resolver los hiatos con diptongación. Además, ambos

concuerdan en que la formación de deslizadas ocurre en dos contextos: una vocal alta

adyacente a otra vocal diferente se deslizará; o una vocal media se eleva a vocal alta

cuando aparece contigua a otra vocal diferente y se desliza; dos vocales idénticas se

fisionan en una; la vocal /a/ siempre es elidida cuando antecede a otra vocal; una vocal

media se elide cuando está antes de una vocal alta de la misma anterioridad; en el resto de

casos, la V1 es la que siempre pierde su silabicidad. En español mexicano, se observa

algo similar, según el mismo Martínez-Gil, aunque hay un poco de variación: sólo las

vocales átonas pueden ser desilabificadas. Por otra parte, en español peninsular, la

pérdida de silabicidad está condicionada por la sonoridad de los elementos en cuestión

según la escala de sonoridad: la vocal con menor nivel de sonoridad es la más proclive a

volverse deslizada independientemente de su posición en la secuencia.

Estos resultados demuestran, por tanto, que la resolución de hiatos en estos dialectos está

motivada por factores lingüísticos o por constricciones diferentes, o, de acuerdo con la

Teoría de la Optimidad (Prince y Smolensky, 2004), por un orden diferente en la

27
aplicación de estas condiciones. En resumen, tenemos que, mientras que el español

chicano recurre a la diptongación siempre que hay dos vocales disímiles en contacto (lo

cual incluye la elevación de vocales medias), el español mexicano se constriñe por el

acento y su posición en la secuencia vocálica; el español peninsular resuelve los hiatos de

vocales distintas considerando la sonoridad de los segmentos en cuestión: la de menor

sonoridad se deslizará. Veamos esto ilustrado:

/lo úso/

chicano [lú.so]

mexicano [lú.so] o [lo.ú.so]

peninsular [lów.so]

Siguiendo a Martínez-Gil, en español chilcano este resultado implica dos procesos: V1,

una vocal media, se eleva a alta; después, teniendo como resultado una secuencia de dos

vocales idénticas /uú/, una de ellas se elide. En español mexicano, el autor propone lo

mismo que para el chicano, pero según mi experiencia, también puede mantenerse el

hiato. La estrategia de diptongación no es viable ya que no se permite dislocación

acentual y el acento reside sobre la /u/, que es la que se deslizaría. En español peninsular,

el resultado es un diptongo con el acento dislocado a la vocal media, pues ésta es más

sonora que la vocal alta en la secuencia, la cual se vuelve entonces deslizada.

Otro estudio relevante es el de Hualde y Prieto (2002). Su objetivo fue investigar la

alternancia vocal-deslizada, es decir, el contraste léxico entre secuencias formando hiato

o diptongo: [du.é.to] vs. [dwé.lo] y [pi.é] vs. [pje] con la finalidad de conocer cuán

extenso era el fenómeno de este contraste y si la clasificación en hiato o diptongo que

28
hacen los hablantes era consistente en el mismo dialecto. Se condujeron dos

experimentos con seis hablantes de Madrid. Éstos consistieron en una prueba de

actuación (lectura de una lista de palabras insertadas en una oración) y una prueba de

competencia (intuiciones sobre silabeo). Sólo se incluyó la secuencia /ia/. Los

informantes repitieron los enunciados tres veces y fueron grabados. Para el análisis, se

obtuvieron las medidas de duración de las secuencias y los promedios por sujeto.

Atendiendo la prueba de competencia, los resultados demuestran que sólo tres sujetos

coincidieron completamente con la silabifiación propuesta por las intuiciones de los

autores. La silabificación de un informante, por otra parte, se desvió considerablemente

de la de los autores. La prueba de actuación (con las medidas de duración obtenidas)

arrojó resultados congruentes con la presuposición de los autores sobre la separación de

las palabras con secuencias diptongadas o hiatizadas en dos clases léxicas. Sin embargo,

estos resultados mostraron variación no sólo del tipo inter-hablante (de uno a otro

hablante), sino también intra-hablante (variación que produce la misma persona).

Face y Alvord (2004) replicaron el estudio de Hualde y Prieto considerando factores

léxicos y acústicos en la percepción del contraste diptongo vs. hiato excepcional

(mantenimiento del hiato en contexto propio de un diptongo) en español peninsular. El

factor léxico era, en concreto, el efecto del ítem léxico individual; y el factor acústico

consistió en las diferencias de duración. Condujeron dos experimentos: una prueba de

producción y tres de percepción con cinco estudiantes universitarios originarios de

Barcelona.

29
El primer experimento fue una réplica del de Hualde y Prieto. Los resultados muestran

que los informantes coincidieron en gran medida en la clasificación de las palabras según

si contenían un hiato o un diptongo; sus intuiciones fueron también muy consistentes con

la hipotética silabificación sugerida por Hualde y Prieto. Nuevamente sólo un informante

se desvió de esta propuesta, ya que la mayoría de las veces silabificaba hiatos cuando se

esperaban diptongos.

En cuanto a la prueba de producción, el promedio de duración de los hiatos hipotéticos

fue mayor que el de los diptongos hipotéticos en el habla de cada hablante, lo cual

confirma también los hallazgos de Hualde y Prieto. Face y Alvord (2004) también

reportan una clara “variation in the mean durations between speakers, and no absolute

threshold could be proposed for the durational boundary between the diphthongs and the

hiatuses, even if only the means (and not the individual tokens) are considered” (p. 558).

Los autores sugieren que esta variación dificulta que los oyentes distingan entre hiatos y

diptongos si se producen por diferentes hablantes. También con este estudio se observó

variación inter-hablante e intra-hablante tanto en la producción como en la percepción de

diptongos e hiatos excepcionales. Los autores concluyen que el factor acústico (la

duración de las secuencias) es uno de los principales aspectos que afecta la distinción

perceptual, con gran precisión, entre hiatos y diptongos. La naturaleza de los ítems

léxicos contribuye en gran medida a la precisión con la que la silabificación de la

secuencia se percibe.

Jenkins (1999) estudió la resolución de hiatos en lindes de palabras en el español de

Nuevo México. Él halló lo siguiente: diptongación 42.2%; elisión de V2 24.6%;

heterosilabificación, menos del 10%; fusión 7.1%; y epéntesis 0.5%. Entre todos los

30
casos de diptongación, 90% forman diptongos crecientes (ya sea con vocales altas

subyacentes o con medias elevadas a altas). Aunque Jenkins llegó a algunas predicciones

en cuanto al uso de estas estrategias, él notó variación en este fenómeno: “What is most

difficult and frustrating when making predictions and descriptions based on the data is

the fact that there is variation. There is no absolute when making linguistic predictions,

but rather general tendencies”. (p. 49).

Alba (2005) también abordó la resolución de hiatos entre palabras en el español de Nuevo

México y encontró mucha variación inter- e intra-hablante. Sin embargo, él descubrió que

la variación en este fenómeno es sistemática y sigue determinados patrones

condicionados por factores como la calidad de la vocal, la frecuencia, el acento, el tipo de

sílaba, la mención previa, y la clase de palabra. El autor observa que en investigaciones

anteriores se ha llegado a descripciones y predicciones de la resolución de hiatos

tomando en cuenta diferentes factores, pero subraya que dichas predicciones varían de un

dialecto a otro; es decir, él sugiere que no debemos ser categóricos en las predicciones

porque el dialecto es una variable relevante a considerar en este fenómeno. Ilustra esto

con las predicciones que hacen Martínez-Gil (2000) y Jenkins (1999) sobre el español

chicano y el de Nuevo México, respectivamente.

 La vocal baja /a/ siempre se elide cuando antecede a otra vocal (Martínez-Gil,

2000: 517)

Habla inglés [áβliŋ.glés]

 La elision de V2 ocurre cuando una vocal baja precede una vocal media o alta

átona (Jenkins, 1999:52)

31
Habla inglés [áβlaŋ.glés]

 Una vocal media (tónica o átona) se elide cuando le prosigue una vocal alta con la

misma retracción de la lengua (Martínez-Gil, 2000: 517)

Compré higuitos [kom.pɾí.ɣí.tos]

 Los elementos tónicos nunca son alterados en la resolución, a menos que estén

adyacentes a otro elemento tónico; el hiato se mantiene cuando una vocal tónica

precede a una vocal distinta de /e/ (Jenkins 1999:52-53)

Compré higuitos [kom.pɾé.i.ɣí.tos]

Como se puede notar, estas predicciones conllevan diferentes resultados en los dialectos

en discusión, lo que sugiere que cada dialecto se rige por diferentes constricciones.

Aguilar (2006) condujo un experimento similar al de Hualde y Prieto (2002), pero ella lo

hizo al nivel postléxico (entre palabras). Su propósito fue observar la resolución del hiato

a partir de tres estrategias en particular: la heterosilabificación (mantenimiento del hiato),

la diptongación y la elisión. Su muestra consistió en cinco hombres universitarios del

centro de España, y su experimento comprendió dos tareas: una lectura de frases y una

conversación controlada en parejas. Las secuencias vocálicas a analizar eran /aa/, /ae/ y

/ai/. Reportó que la estrategia más común de resolución fue la heterosilabificación (45%),

seguida de diptongación (32%), y elisión al final con (23%). Encontró que el acento

parece ser el factor determinante en la selección de la estrategia para resolver el hiato. De

acuerdo con Aguilar, si V1 es tónica, pero V2 es átona, entonces la estrategia más común

32
es diptongación. Por el contrario, si V2 es tónica y V1 es átona, se prefiere mantener el

hiato.

Desde una perspectiva histórica y considerando varias lenguas, Chitoran y Hualde (2007)

estudiaron la evolución de las secuencias vocálicas en las lenguas romances observando

en particular que la variación en la pronunciación de las secuencias iV puede incluir

realizaciones con diptongo [jV]. Ellos sugieren que en francés e italiano hay una

tendencia a producir consistentemente diptongos con secuencias de vocoides de

sonoridad creciente. En español, algo similar ocurre, pero los hiatos son posibles o

preferidos en algunos casos. Observan una gran variación dialectal e interdialectal en esta

lengua. Por otra parte, en rumano y portugués, hay una preferencia por los hiatos.

Aclaran también que en rumano hay un contraste entre hiatos y diptongos en algunos

ítems léxicos, pero esto no sucede en portugués. El esquema siguiente muestra estas ideas

como un continuo:

(Chitoran y Hualde 2007, p. 40)

Figura 1 Continuo diptongo-hiato en lenguas romances

Los autores explican la variación en el grado de contraste entre diptongos e hiatos en

estas lenguas a partir de factores históricos y prosódicos:

(i) the stable coordination of diphthongs as general articulatory


attractors, affecting the ‘direction’ of the change;

33
(ii) pre-existing unambiguous [jV] diphthongs from other sources
as language-specific attractors, affecting the ‘speed’ of the change;
(iii) prosodically determined lengthening of iV, which can inhibit
diphthongisation and affect the ‘trajectory’ of the change by
determining gradient patterns of hiatus to diphthong shifts in the
lexicon. (p. 64)

Si comparamos los resultados de las investigaciones abordadas en esta sección, es

evidente que hay varias maneras de enfrentar los hiatos y que una estrategia puede ser

más común en un dialecto que en otro; que no necesariamente se usan las mismas

estrategias en las diferentes variedades del español; que tampoco son las mismas

utilizadas en el nivel léxico que en el nivel postléxico; que los hablantes del mismo

dialecto usan recursos diferentes ante el hiato, y que incluso un mismo hablante puede

mostrar variación en sus estrategias. Alba (2005), consciente de esto, concluye que:

It would be inappropriate, therefore, to propose a set of


formal generalizations about hiatus resolution as previous
accounts have done based on the patterns found. Such facts
lead us to conclude that, hiatus resolution does not conform
to a set of formal, abstract rules, but rather, that there is
inherent variability. (p. 229)
Sin embargo, si acordamos que la variación no es libre ni desordenada, siguiendo un

método y una teoría adecuados podemos intentar contribuir a describir dicha variación a

partir de otros dialectos y perspectivas. Para esto, hemos ya revisado en las páginas

anteriores que la variación puede estar condicionada por factores internos y externos.

Dentro de estos últimos, género, edad, educación, y estatus socioeconómico se

discutieron ya además de estilo y velocidad. Algunos aspectos internos como el acento y

la sonoridad se mencionaron brevemente. Es necesario ahora dedicar un espacio a las

34
descripciones y explicaciones que se han dado sobre los factores lingüísticos y su papel

en la resolución de hiatos.

2.3 Factores lingüísticos como condicionantes de la resolución de hiatos

A continuación se presenta un resumen de algunos factores lingüísticos condicionantes

del uso de estrategias para resolver los hiatos en español, según las predicciones de

diferentes estudiosos (cfr. Alba, 2005: 3-4). Ya que la presente investigación se limita al

estudio de la resolución de hiatos en el nivel léxico, el resumen original se ha reducido o

expandido considerando el posible efecto de los factores en el nivel léxico.

1. Tipo de sílaba. Considerando el hiato entre palabras, según Monroy Casas (1980),

la segunda vocal (V2 en adelante) del hiato suele ser elidida si ésta se encuentra en

una sílaba cerrada o trabada.

2. Posición de las vocales. Tendencia a conservar la segunda vocal (V2) más que la

primera vocal (V1 en adelante). (Contreras 1969, Hutchinson & Pinkerton 1974,

Hualde 1994, Casali 1996, 1997; Jenkins 1999, Martinez-Gil 2000).

3. El acento. El acento en una o ambas vocales afecta ciertos tipos de resolución. En

el dialecto mexicano, de acuerdo con Martínez-Gil (2000) y Morris (1998), las

vocales tónicas tienden a mantenerse como nucleares. De la misma manera,

Jenkins (1999) y Alba (2005, 2006) coinciden en que las vocales tónicas en los

lindes de palabra del español de Nuevo México se mantienen mucho más que las

átonas en resolución de hiatos, a menos que la vocal adyacente también sea

tónica.

35
4. Morfemas implicados. Se sugiere que el material fonológico de la raíz es más

resistente al cambio que el material de los afijos. De esta manera, la vocal de una

raíz se conservará más fácilmente que una vocal de un afijo cuando las dos estén

en contacto (Casali 1996, 1997; Jenkins, 1999). Jenkins apoya esta postura, pero

la lleva aun más lejos al sugerir que en los verbos no sólo las vocales en la raíz se

resisten al cambio, sino incluso también las desinencias verbales se resisten a

cualquier tipo de reducción.

5. Contenido léxico. Las vocales en contacto en las palabras de contenido (content

words) se mantienen más que las de las palabras funcionales (function words).

(Casali 1996, 1997; Jenkins, 1999; D’Introno et al., 1995)

6. Restricciones sintácticas. La resolución de hiato a través de la formación de una

paravocal o deslizada ocurre con mayor probabilidad en el siguiente orden: sin

linde> linde morfémico> linde de palabra > linde de frase. (Cressey, 1978).

Podemos agregar tres más a la lista:

7. Grado de sonoridad de las vocales. En el español peninsular, se observa una

tendencia a la diptongación determinada por la sonoridad de las vocales

involucradas. Se sugiere que la vocal menos sonora es la más proclive a sufrir

algún tipo de reducción, sin importar su posición en la secuencia de vocales.

(Navarro Tomás, 1967; Hualde, 1994; Morris, 1998; Martínez-Gil, 2000).

8. Calidad de las vocales. Alba (2005, 2006) reporta que la calidad de las vocales

desempeña un papel crucial para las estrategias de resolución que se seleccionan.

Sus hallazgos indican que si tenemos vocales bajas o medias en la segunda

36
posición (V2) (a#a, a#e, a#o), esta condición favorece la reducción silábica,

mientras que las vocales altas en esta misma posición la desfavorecen. Por otra

parte, Martínez-Gil (2000: 517) sugiere que la vocal baja /a/ siempre se elide

antes de otra vocal en sinalefa, y que las vocales medias (tónicas o átonas) se

eliden cuando están precedidas de una vocal alta con la misma retracción de la

lengua.

9. Efecto léxico. Face y Alvord (2004) encontraron que la percepción de

silabificación de secuencias de vocoides se ve influenciada por la naturaleza del

ítem léxico.

Estos factores no son categóricos de la resolución de hiato en español. Como se advirtió

previamente, éste es un fenómeno variable y algunos factores pueden afectar de manera

interdialectal, pero otros pueden influir sólo un dialecto o una variedad.

Dado que esta investigación está limitada a la resolución de hiatos en el nivel léxico y

concretamente a los verbos –ear del español mexicano, me enfocaré en factores

lingüísticos tales como la calidad de la vocal, la estructura silábica, la calidad de las

vocales, el acento, y el grado de sonoridad. El contenido léxico es irrelevante pues

trabajaré solamente con verbos (palabras de contenido) y no es necesaria la distinción

entre éstas y las palabras funcionales. De igual manera resulta innecesario atender las

restricciones sintácticas, ya que no se distinguirá entre los tipos de lindes. Finalmente,

tampoco se diferenciará el tipo de morfemas implicados porque siempre será el mismo: la

raíz del verbo + desinencia de los verbos –ear (formas finitas y no finitas).

37
Con la intención de tener una idea clara de estos factores internos que constriñen la

resolución de hiato en español, enseguida revisamos algunos conceptos, nociones y

teorías indispensables para entender mejor este fenómeno y su comportamiento.

2.4 Vocales y deslizadas

La diptongación se ha descrito como una de las estrategias más comunes en la resolución

de hiatos en español. Como arriba se indicó, la diptongación en español implica la

formación de deslizadas, ya sea de altas o medias. Este proceso conlleva un cambio de

vocal a deslizada. Por tanto, entender las diferencias entre vocales y deslizadas es

imprescindible para este estudio.

2.4.1 Vocales y deslizadas desde un punto de vista fonético

Según Levi (2004), la constricción, la duración, la amplitud, y la posición en la sílaba se

han citado como indicadores fonético-fonológicos que distinguen las vocales de las

deslizadas. Veamos cada una de ellas.

Constricción

La constricción o manera de articulación se ha considerado por mucho tiempo como una

de las principales diferencias entre vocales y deslizadas. Clark y Yallop (2007), de hecho,

enfatizan la constricción como la característica articulatoria definitiva entre estos

elementos. Asimismo, Crystal (1991) define las vocales como: [… ] “sounds articulated

without a complete closure in the mouth or a degree of narrowing which would produce

audible friction; the air escapes evenly over the centre of the tongue” (p. 376-377).

38
Describe las deslizadas, por otro lado, como “a transitional sound as the vocal organs

move towards or away from an articulation” (p. 153).

Kenstowicz (1994) nota que las deslizadas [y] y [w]4 están muy relacionadas con las

vocales altas /i, u/, y que la diferencia entre ellas es que al articular las vocales, una

constricción lenta ocurre en el dorso de la lengua, entonces la pronunciación se vuelve [j]

y [w]. Para este autor, las deslizadas en inglés son variantes de las vocales altas.

Maddieson & Emmory (1985) demuestran por medio de evidencias acústicas que hay una

diferencia articulatoria entre las vocales altas y las deslizadas en Amharic, Yoruba, and

Zuni, pues éstas se producen con constricciones más estrechas en el tracto vocal.

También Straka (1964) ya había ofrecido evidencias de esta diferencia de articulación.

Duración

Catford (1977) –citado por Levi, 2004– considera que las deslizadas no tienen un estado

continuo o estable, pero que los percibimos aún así como segmentos. Él argumenta que

las vocales y las deslizadas son lo mismo en cuanto a la constricción, pero que su

diferencia radica en su “notable” duración.

Amplitud

La amplitud ha sido otra propiedad usada para distinguir las deslizadas de las vocales

(Jones, 1918; Sweet, 1890 –citados por Levi, 2004–). Clark et al. (2007) definen amplitud

como “[…] a measure of the size of vibration or the extent of movement in the vibration.

4
Los símbolos de la AFI [j] y [w] se usarán en este estudio para la deslizada alta anterior y posterior,
respectivamente, pero mantengo los símbolos de otros autores al citarlos.

39
Amplitude relates to what we normally call loudness, and as the amplitude of a vibration

diminishes, it becomes less audible” (p. 205). De esta manera, se sugiere que las

deslizadas se producen con menos esfuerzo respiratorio comparado con la pronunciación

de las vocales.

Posición en la sílaba

De acuerdo con Jakobson, Fant and Halle (1952), las deslizadas en inglés no tienen un

estatus fonémico. Generalmente se ha pensado que la posición en la sílaba es lo que

determina la diferencia entre vocales y deslizadas. Ladefoged (2001) -y un sinnúmero de

lingüistas- define las vocales como vocoides silábicos y las deslizadas como vocoides no

silábicos, aunque admite los significados imprecisos de los términos “sílaba” y

“silábico”. En este mismo sentido, Aguilar (1999) critica el hecho de que la silabicidad se

use como criterio para distinguir entre una vocal y una deslizada, pues arguye que la

propiedad de silabicidad no ha sido definida con precisión en términos fonéticos.

Considerando lo anterior, Padgett (2008) resume las distinciones fonéticas encontradas en

la literatura, las cuales se basan en dos principales aspectos:

• En cuanto a la dinámica:

En las vocales se observan lentas transiciones formánticas así como un posible estado

constante o estable; en las deslizadas, las transiciones son rápidas y siempre cambiantes.

• En cuanto a la constricción:

En las vocales, hay formantes intensos y no hay fricación; en las deslizadas, hay

formantes menos intensos y una posible fricación.

40
Padgett (2008:2) ilustra estas diferencias por medio de los siguientes espectrogramas de

[aia], [ai̯ a], y [aja]:

a i a a i̯ a a j a
Figura 2. Espectrogramas de [aia], [ai̯ a], y [aja]

El mismo autor comparó estos grupos vocálicos y observó que el primer grupo trisilábico

[aia] tiene una duración mayor que el grupo disilábico [ai̯ a], y que el primero tiene una

porción más constante/estable. La deslizada en [ai̯ a] consiste principalmente de

transiciones en los formantes y las transiciones del segundo formante parecen más

abruptas lo que significa un tipo de cambio más veloz. Con respecto a [aja], hay una

diferencia en el grado de constricción o fricación, ya que [j] implica más ruido turbulento

en las frecuencias más altas. Con esas categorías y descripciones, Padgett llama

semivocales a las deslizadas que difieren de las vocales sólo en aspectos dinámicos [i̯ / u̯];

y deslizadas consonantizadas a las que difieren en el grado de constricción o fricación

[j/w].

Acústicamente, hablar de deslizadas en español significa hablar de diptongos, pues éste

es el contexto fonológico donde emergen. Aguilar (1999) afirma que los hiatos y

41
diptongos difieren en el dominio de frecuencia temporal: los hiatos tienen una duración

mayor y también un grado mayor de curvatura en la trayectoria de F2 que los diptongos.

Los hiatos pueden tener dos partes estables (continuas o firmes) en la estructura de los

formantes, correspondiendo a cada una de las vocales del grupo, pero en general parece

que el primer y segundo formantes se mueven dirigidos a producir la primera vocal, y

después aparecen dirigidos a producir la segunda vocal sin lograrlo en realidad. Por otra

parte, en los espectrogramas de diptongos, raramente se observan dos partes en estado

estable o regular en la estructura de los formantes; en su lugar, lo que generalmente se

observa es una transición continua de un área de frecuencia a otra (p. 62).

Aguilar (2006) ilustran estas diferencias con los siguientes espectrogramas:

Figura 3. Secuencia [a ‘i] en hiato en copa hípica

42
Figure 4. Secuencia [‘ai] en diptongo en patata iqueña.

Sobre el mismo tema, Martínez-Celdrán (1984) observa que:

[en hiato] espectrográficamente, esas dos vocales mantienen sus


propios formantes bien diferenciados; se saltará de un formante a otro
bruscamente. En cambio, en el diptongo, la glide ha perdido su propia
autonomía, se ha sometido a la vocal que forma el núcleo silábico y esa
dependencia se muestra espectrográficamente como si el formante de la
glide fuese un mero apéndice del núcleo silábico; es, en definitiva, una
transición muy prolongada del segundo formante de la vocal de la que
depende (p.221).

Aunque se ha avanzado con las descripciones de vocales y deslizadas, resulta interesante,

como anteriormente se discutió, que los hiatos y los diptongos están sujetos a

modificaciones debidas a cambios en la situación comunicativa. Así lo demuestra la

misma Aguilar, quien condujo un estudio experimental en el que incluyó como variable

el tipo de comunicación. Para ello, usó una lectura y una conversación controlada en

parejas. Los resultados muestran que, independientemente del tipo de actividad, los hiatos

tienen una duración mayor que los diptongos. Sin embargo, sí hay cierta diferencia entre

los mismos hiatos y diptongos en cuanto al tipo de situación de habla. En la lectura, el

promedio de duración de los hiatos fue de 193 ms (desviación estándar de .44); y 141 ms

43
de los diptongos (desviación estándar de .37). Comparando estos resultados con los de la

actividad de conversación, los datos de la lectura muestran un incremento del 36% en la

duración de los hiatos y, específicamente, de un 26% en el caso de los hiatos palatales y

de un 47% en el de los velares con respecto a los producidos en la conversación.

Desde una perspectiva perceptual, Coren y Warren (2004) llevaron a cabo un

experimento para examinar el papel de la duración en la percepción de las deslizadas y

las vocales en inglés. Usaron dos indicadores de velocidad para los tokens de la palabra

“rodeo”, y veinte sujetos participaron en este estudio. Sus resultados fueron que el 50%

de los oyentes juzgaron el vocoide como vocal y 50% lo juzgó como deslizada cuando la

duración de la V1 era aproximadamente la mitad de la segunda. Los autores llegaron a la

conclusión de que en habla rápida, la duración relativa de V1 es muy importante para

distinguir perceptualmente una vocal de una deslizada.

Considerar estos indicadores fonéticos es crucial para la distinción entre deslizadas y

vocales. Sin embargo, el cuadro sobre las deslizadas no es del todo completo, pues hasta

ahora sólo se ha hablado de las deslizadas altas. En la siguiente sección abordamos las

deslizadas medias, un tema poco abordado en la literatura en español.

2.4.2 El caso de las deslizadas medias

Aunque en la lingüística hispánica tradicional sólo los vocoides altos [j] y [w] se

consideran deslizadas, recientemente un creciente número de estudiosos han acordado,

según sus hallazgos, en la existencia de deslizadas medias en español (Rosenthal, 1994;

44
Nuñez-Cedeño & Morales-Font, 1999; Morris, 1998; Aguilar, 2003; Vuskovich, 2006;

Hualde, 2005; Hualde et al. 2008). Hualde (2005), por ejemplo, señala que:

We can also find midglides [e̯] and [o̯], in colloquial speech, as in bisyllabic
línea [lí.ne̯a] ‘line’, poeta [po̯e.ta] ‘poet’, for more careful trisyllabic [lí.ne.a],
[po.e.ta]. There is no question about the allophonic nature of these midglides.
(p.55)

En consonancia con esto, Hualde et al. (2008) observan que:

The fact that the IPA has special symbols for high glides, [j], [w], but not for
mid glides, which require the use of diacritics on the symbols for mid vowels,
nonsyllabic, [e̯], [o̯] or extrashort [ĕ], [ŏ], appears to reflect the relative
crosslinguistic rarity of nonhigh glides (p.1906).

Resulta interesante notar que la aproximación a estas deslizadas medias en español, en

general, ha sido a través de estudios cualitativos y desde una perspectiva fonológica. En

términos fonéticos, ya Navarro Tomás (1918) reconocía que las vocales medias sufrían

cambios al aparecer de manera contigua a otra vocal, aunque no las llama deslizadas

medias.

las vocales [e], [o] delante de [a] se cierran y abrevian, relajando su articulación,
apagando su sonido y produciéndose, aunque con mayor abertura, con un
movimiento análogo al de las semiconsonantes [j], [w]; en los casos en que se
encuentran juntas las vocales [e], [o], el elemento que se cierra y abrevia es el
que va en primer lugar; detrás de la [a], las vocales [e], [o] se abrevian y relajan
también, pero conservan su propio timbre más claramente que en los casos
anteriores.

Aguilar (2003, 2006) argumenta que fonéticamente el español tiene deslizadas altas y no

altas. En su estudio de 2006, investiga las secuencias vocálicas y su resolución en español

en el nivel postléxico. Para ello, integró un corpus de lecturas con palabras contiguas

(sustantivo y adjetivo) que presentaban las combinaciones vocálicas [a] seguidas de [a],

45
[e], o [i]; e incluían todos los patrones acentuales posibles: [aa], [áa],[aá], [áá], [ae], [áe],

[aé], [áé], [ai], [ái], [aí], [áí]. Se incluyeron estas combinaciones de sustantivo + adjetivo

dos veces en los textos para que el informante la repitiera dos veces y se pudieran hacer

comparaciones. Aunque la autora señala inicialmente que el contexto fonológico que

rodeaba a las vocales comprendía una oclusiva sorda bilabial o dental con el objeto de

neutralizar la influencia de las consonantes, en realidad se observa que también incluyó la

oclusiva velar sorda; es decir, el grupo de consonantes que rodeaban la secuencia

vocálica se conformó por oclusivas sordas. Los informantes fueron cinco hombres

originarios de España.

Con el uso de espectrogramas, se obtuvo información sobre la calidad y duración de las

secuencias y se determinó la resolución usada en la producción de vocales en contacto.

La autora consideró tres categorías: heterosilabificación, reducción (diptongos) y elisión.

Considerando las deslizadas medias como nuestro tema de interés en esta sección,

Aguilar encontró que, en cuanto a los grupos de vocales distintas, los indicadores

acústicos revelan la presencia de un diptongo sin importar si una vocal alta está implicada

o no. Es decir, una secuencia vocálica se vuelve diptongo cuando una de sus partes

constantes o firmes desaparece y se puede ver una transición continua del segundo

formante de un área de frecuencia formántica a otra. La misma autora muestra este punto

con diferentes espectrogramas. Veamos los siguientes donde comparamos un hiato con

un diptongo:

46
Figura 5. Secuencia [a ´e] en lindes de palabra: hiato en estopa épico.

Aquí se observan claramente dos vocales en la forma de la onda y dos centros vocálicos

en el espectrograma. Aunque es difícil dividir la onda en segmentos que se correspondan

con las unidades fonéticas, “es posible separar dos vocales incluso en los casos de timbre

idéntico” (p. 365). En este último caso hay un descenso de amplitud en el paso de una

vocal a otra.

47
Figura 6. Secuencia [‘ta ek] en lindes de palabras: diptongo en tacatá ecológico.

En este caso de diptongo, una zona estable desaparece y observamos una transición

continua del segundo formante cambiando de frecuencias formánticas. La autora agrega

que la diferencia entre una deslizada alta y una no alta reside en la localización de las

frecuencias, pero no en el tipo de movimiento. Entonces, si comparamos el

espectrograma previo (diptongo con deslizada media) y el siguiente (diptongo con

deslizada alta), se puede ver esto más claramente:

48
Figura 7. Secuencia [‘ta ik] en lindes de palabras: diptongo en patata iqueña.

En el caso de diptongo con deslizada alta, el segundo formante de la vocal [a] muestra

frecuencias superiores a las que generalmente se observan, y el segundo formante de [i]

se presenta en áreas frecuenciales inferiores a las habituales.

Chitoran (2002) estudió las deslizadas en rumano comparando dos diptongos ([ea], [oa])

y las dos secuencias deslizada-vocal ([ja], [wa]). Aunque todas estas secuencias pueden

describirse como diptongos, la autora las distingue con términos diferentes porque

argumenta que hay representaciones fonológicas diferentes para cada grupo. Condujo

experimentos de producción y percepción con el objeto de encontrar evidencia acústica y

perceptual que apoye las diferentes representaciones fonológicas que ella arguye para los

diptongos y las secuencias. Para el experimento de producción, cuatro nativo hablantes

leyeron tres veces una lista de palabras que incluía los diptongos y las secuencias de

interés. Se hicieron grabaciones de sus lecturas y se analizaron los datos obteniendo las

medidas en espectrogramas de banda ancha y oscilogramas, las cuales consistieron en la

49
duración total, la duración de la transición, la velocidad de transición, y valores de inicio

de F2.

Los resultados muestran que la secuencia [ja] fue significativamente más larga que [ea]

(p=.000 para los cuatro hablantes). La duración total de [wa] y [oa] es comparable para

todos los sujetos (p>.05). y en cuanto a la duración de la transición, se encontró que [ja]

fue significativamente más larga que [ea] para los cuatro hablantes (p=.000), mientras

que en los casos de [wa] y [oa] no se identificó ninguna diferencia estadísticamente

significativa (p>.05).

La secuencia [ja] mostró una velocidad de transición de F2 significativamente mayor que

la del diptongo [ea]. F2 tiene una curvatura más pronunciada en [ja] que en [ea], y

entonces la velocidad a la que el segundo formante baja es mayor en la secuencia de

deslizada-vocal. Un valor mayor indica una velocidad de transición más rápido. La

diferencia fue estadísticamente significativa para los cuatro hablantes (p=.000). Sin

embargo, la velocidad de transición para [wa] y [oa] fue comparable (p>.05). En cuanto a

los valores de inicio de F2, los resultados muestran diferencias entre [ja] y [ea] con un

inicio de F2 más alto para [j] que para [e] (p=.000). Los valores de inicio de F2 fueron

comparables para [wa] y [oa] en tres de los sujetos.

Con el experimento de percepción, Chitoran (2002) probó la habilidad de los hablantes de

percibir los diptongos y las secuencias. La autora reporta como hallazgos que la

secuencia [ja] y el diptongo [ea] fueron identificados correctamente con un nivel de

significancia de .05 (z=33). La secuencia [ja] fue identificada correctamente 89% de las

veces (z=39), y el diptongo [ea] 78% (z=28). Por otra parte, el test para [wa] [oa] arrojó

50
resultados diferentes. El número de respuestas correctas no es significativa en el nivel de

p=.05 level (z=3). La secuencia [wa] fue identificada correctamente 46% de las veces

(z=4), y el diptongo [oa] 48% (z=2). Con estas evidencias, Chitoran apoya un análisis

fonológico diferente para las secuencias deslizada-vocal [ja] y para los diptongos [ea], el

cual se discutirá en la siguiente sección. También, ofrece indicadores acústicos para

distinguir la secuencia [ja] y el diptongo [ea] en los cuales deslizadas altas y medias

intervienen. En su análisis no incluye los vocoides posteriores, dado que los resultados

obtenidos no fueron contundentes ni significativos y no ofrecen la evidencia necesaria

que apoyen su propuesta teórica.

Retomando la lengua española y la diptongación como estrategia para resolver hiatos,

tenemos que en este caso una de las vocales pierde silabicidad y emerge como deslizada.

Un fenómeno dialectal bien conocido en español es que las vocales medias en algún paso

del proceso cambian de timbre y emergen en estos contextos como deslizadas altas. Cury

Lambraño (2004), por ejemplo, cita más de cien palabras con diptongos derivados de

vocales medias que cambian su timbre: oa>ua , ea>ia, eo>io, ee>ie como característica

del habla costeña de Colombia. En el mismo sentido, pero atendiendo el español

mexicano, Moreno de Alba (1994) subraya que el fenómeno de diptongación de hiatos se

menciona desde los primeros estudios conocidos y que éste se atribuye a la pronunciación

del español de todos los mexicanos y no sólo de algunos de sus dialectos.

Hualde et al. (2008) argumentan que actualmente hay una neutralización entre los

fonemas vocálicos altos y medios, pues ambos se realizan como deslizadas altas en

secuencias VV formando diptongos. También señalan que hay mucha conciencia social

de este proceso entre los hablantes. En su estudio encontraron, sin embargo, que las

51
secuencias de vocales no altas en español muestran considerable variación en su

realización; ellos distinguieron dos principales estrategias de resolución: asimilación (o

elisión como algunos autores la llaman) ea>a; y disimilación (también la llaman

deslizamiento) ea>ja.

Garrido (2007) discute la resolución de secuencias vocálicas en el español colombiano y

cita como ejemplos los de Alonso (1930): acordeón >acordión, león > lion , toalla >

tualla. Señala que la diptongación es un fenómeno que ha caracterizado la evolución del

español, pues la tendencia general ha sido formar diptongos a partir de hiatos: Ital[i.a] 

Ital[ja]; Hispan[i.a]  Hispan[ja]. Incluso, hiatos que surgieron con la elisión de una

consonante intervocálica, también se diptongaron: regina  re.í.na  réi.na. Agrega que

esta tendencia a resolver hiatos puede darse alterando la calidad de una de las vocales

involucradas: petról[e.o]  petról[jo], o trasladando el acento a otra vocal /má.is/ >

/máis/. En su artículo, Garrido analizó la variación en la articulación de las secuencias IO

y EO, siendo las primeras pronunciadas como diptongos y las segundas como hiatos,

según las reglas. Comparó los datos de dos regiones dialectales del español de Colombia

(andino y caribeño), además de dos diferentes estilos.

En su estudio participaron diez hombres y siete mujeres, todos estudiantes universitarios

monolingües con edades entre 18 y 25 años. De ellos, ocho eran del dialecto andino, y

nueve, del caribeño. Realizaron dos tareas: en la primera, los informantes leyeron una

lista de palabras objetivo (con la secuencias de interés) incluidas en una misma frase

“Digo ______ para ti”. Las palabras objetivo contenían la secuencia /io/ pronunciada

como diptongo y la secuencia /eo/ pronunciada como hiato según las normas. Las

palabras se clasificaron según la posición del acento (pretónicas, tónicas y postónicas).

52
En la segunda tarea, los sujetos, con ayuda de unos dibujos, tenían que narrar una historia

usando las palabras que ellos veían representadas en los dibujos. La duración de los

segmentos y los valores formánticos (F1) fueron los correlatos acústicos seleccionados

para determinar si la secuencia se pronunciaba como hiato o diptongo y si había un

cambio en la calidad de la vocal, ya que a menor valor de F1 del primer elemento de la

secuencia, mayor grado de diptongación.

Los resultados muestran que en la tarea de lectura no hubo diferencia significativa en la

duración del diptongo [jo] en los dos grupos dialectales. Sin embargo, en cuanto a la

secuencia [eo], los hablantes andinos la pronuncian con una duración mayor. En cuanto a

los valores de F1, los hablantes andinos muestran valores más altos de F1 tanto en

posición pretónica como tónica, lo que indica que el primer elemento de la secuencia se

mantiene como vocal media. Los hablantes caribeños, por el contrario, pronunciaron la

/e/ con valores de F1 más bajos, lo que sugiere que en su articulación el primer elemento

es similar a la deslizada [j]. En posición tónica, los andinos muestran una mayor

diferencia entre [jo] y [eo]. Los resultados sugieren, como la autora declara, que aunque

ambos dialectos mantienen el contraste de calidad vocálica entre [j] y [e], la articulación

de los caribeños muestra una tendencia a la neutralización. Es decir, en el español

caribeño hay una tendencia mayor a diptongar las secuencias hiáticas (la diferencia de

duración entre [jo] y [eo] se neutraliza), mientras que los hablantes andinos tienden a

mantener el contraste entre diptongos e hiatos.

Con respecto a la tarea de narración, las secuencias vocálicas tuvieron una duración

menor en comparación con las de la lectura en ambos grupos dialectales, tal como se

esperaba de un contraste en estilo espontáneo (narración) versus formal (lectura). Esta

53
neutralización del contraste regional en esta tarea de narración indica, de acuerdo con la

autora, que el estilo es un factor restrictivo en la diptongación de secuencias vocálicas

media/baja. Esto se evidencia en la claridad de contraste hiato/diptongo que mantienen

los andinos en estilo formal o cuidadoso; no obstante, dicho contraste desaparece en

habla informal o espontánea.

Como se discutió en la sección sobre variación, estilo y dialecto, aquí una vez más se

muestra cómo los factores externos influyen en la producción de hiatos y diptongos. Lo

relevante para nuestro estudio es que los resultados de Hualde et al (2008) y Garrido

(2007) no son concluyentes respecto a la realización de una deslizada media o una alta.

Ya que la diptongación de hiatos parece ser un proceso continuo, establecer las

diferencias reales entre una deslizada media y una alta requiere de más investigación, tal

como lo sugirieron Hualde et al. En realidad, en muchos estudios cualitativos, se toma

por hecho la elevación de la vocal media al formar diptongos.

En un estudio de corte sociolingüístico, Vuskovich (2006) encontró que la formación de

deslizadas no altas es la estrategia más común de resolución de hiato en México. Él

argumenta que, como las vocales altas, las vocales medias pueden también perder su

silabicidad, “but do not typically become full glides in certain dialects”. Dado que el

análisis de los datos se hizo de manera impresionista, no ofreció indicadores acústicos

para apoyar su argumento.

54
2.4.3 Vocales y deslizadas desde una perspectiva fonológica

Crystal (1991) define las vocales como el centro de la sílaba. Sin embargo, no especifica

la posición ni función de las deslizadas en la sílaba. La distinción entre deslizadas y

vocales ha sido un tema abordado desde diferentes enfoques teóricos. Aquí presentamos

sucintamente algunos de los más relevantes en torno a esta distinción.

Sound Pattern of English

En el marco de la teoría de The Sound Pattern of English (Chomsky y Halle, 1968), las

vocales se distinguen de las deslizadas por el rasgo [± silábico]; es decir, las vocales son

[+silábico], y las deslizadas son [-silábico]. De esta manera, las vocales son el centro o la

cima de una sílaba mientras que las deslizadas se encuentran en la periferia. Esta

categorización conlleva así al concepto de sílaba, pero aquí la situación se torna

complicada, pues SPE no define lo que es una sílaba en detalle. Bajo esta perspectiva, se

asume que cada vocal corresponde a una sílaba. SPE deja muchas lagunas en este tema y

no se contestan preguntas relacionadas con la representación de los diptongos, las vocales

fusionadas, ni la alternancia deslizada/vocal.

Para Selkirk (1982), la sílaba se caracteriza por estar conformada por constituyentes

internos referidos como ataque, rima, cima y coda. Bajo este enfoque, los diptongos son

‘vocales complejas’ situadas en una cima ramificada que tiene dos nodos: débil y fuerte;

la deslizada se ubica bajo el nodo débil y la vocal bajo el nodo fuerte. Veamos esto más

claramente con el ejemplo siguiente del inglés:

55
Figura 8. Estructura silábica de Selkirk

Fonología CV

En el marco teórico de la fonología generativista, tenemos también esta otra vertiente no

lineal: la autosegmental (Clements y Keyser, 1983). La teoría autosegmental o fonología

CV no necesita el rasgo [silábico], pues la distinción entre [± silábico] está representada

en el nivel fundamental del esqueleto prosódico integrado por dos elementos primitivos:

C (no silábico) ó V (silábico). Como se observa abajo, la segunda parte del diptongo se

clasifica en esta teoría como una consonante. Las vocales derivadas se enlazan con dos

espacios correspondientes a C y a V, mientras que las vocales subyacentes se enlazan con

dos Vs. Esta flexibilidad resulta relevante para el fenómeno de hiato y formación de

diptongos. Veamos el ejemplo:

Figura 9. La sílaba en CV

56
Clements y Keyser proponen un nivel nuclear o fundamental que definen como una

categoría prosódica que consiste de secuencias tautosilábicas de V(X). Aquí hacen una

distinción entre diptongos crecientes (deslizada + vocal) y diptongos decrecientes (vocal

+ deslizada)5; y las sílabas se clasifican en ligeras o pesadas. Así, un diptongo creciente

ligero consiste de un núcleo (v), el cual tiene una vocal. Un diptongo decreciente pesado

tiene un núcleo con dos espacios asignados:

Figura 10. Diptongo e hiato en CV

Steriade (1982) y Selkirk (1984) agregan a esta teoría la noción de la escala jerárquica

universal de sonoridad (siguiendo Hooper, 1976 y Harris, 1982). Para Steriade, las

vocales altas [i] y [u] tienen un lugar propio en la jerarquía, pero éstas no se distinguen de

sus contrapartes deslizadas. Ésta es la jerarquía que propone:

Escala 10 9 8 7 6 5 4 3 2 1 .5
Segmentos a e,o i,u r l m,n s v,z,đ f,t b,d,g p,t,k

Figura 11. Escala universal de sonoridad

5
Como anteriormente se señaló, en la literatura hispana, se distingue entre semiconsonantes (cuando una
deslizada precede una vocal) y semivocales (cuando la deslizada sigue una vocal).

57
Selkirk, por su parte, propuso una Generalización de Sonoridad Secuencial, la cual

establece que:

In any syllable, there is a segment constituting a sonority peak that is


preceded and/or followed by a sequence of segments with progressively
decreasing sonority values. (Selkirk, 1984:116)

Esta noción resulta relevante porque permea las subsecuentes propuestas teóricas con

respecto a la sílaba, y será abordada en la siguiente sección.

La teoría X

Esta teoría, representada por Levin (1985), propone una teoría de la silabificación basada

en la estructura de un esqueleto gradado compuesto por espacios vacíos denotados por Xs

en lugar de Cs y Vs. El núcleo en esta estructura es la que determina la silabicidad. Por lo

tanto, tampoco hay necesidad de un rasgo [silábico]. El siguiente es un ejemplo de su

propuesta, con un núcleo (N) y sus proyecciones (N’ y N’’):

Figura 12. La sílaba en la teoría X

58
Resulta interesante que el diptongo decreciente se representa en un núcleo ramificado con

dos espacios X, mientras que la deslizada en el diptongo creciente comparte el espacio

con la consonante como si ambas fueran parte del ataque.

La teoría moraica

Hyman (1985) argumenta a favor de una estructura gradada compuesta por “unidades de

peso”, lo cual se corresponde con la noción de ‘mora’. Propone que el nivel de duración

debe ser reinterpretado de manera que represente el peso fonológico. De esta manera, las

vocales largas y los diptongos decrecientes se asocian con dos moras, mientras que las

vocales cortas y los diptongos crecientes se asocian con una mora. Ver ejemplo abajo 6:

Figura 13. La sílaba en la teoría moraica

Aunque en general se habla de deslizadas involucrando vocoides altos, en rumano

encontramos diptongos con vocales medias. Utilizando el marco de la teoría moraica,

Chitoran (2001) distingue los diptongos ([ea], [oa]) de las secuencias deslizada-vocal

6
μ representa una mora.

59
([ja], [wa]) en rumano y propone una representación fonológica diferente para cada

grupo. Así, para los diptongos, sugiere:

Figura 14. Diptongo en rumano

Ambos elementos del diptongo los representa compartiendo un núcleo silábico, lo que

predice que los diptongos funcionan como una sola unidad y un solo segmento. Para las

secuencias de deslizada-vocal, propone la siguiente representación fonológica, donde

como puede observarse, aquí sólo la vocal pertenece al núcleo, mientras que la deslizada

forma parte del ataque.

Figura 15. Secuencia deslizada-vocal en rumano

Esta breve revisión de los diferentes análisis de la silabificación de las deslizadas y las

vocales nos muestra los diferentes cambios y perspectivas que ha habido en la teoría

fonológica en cuanto a su representación. La adición de nuevas nociones como la escala

de sonoridad, los constituyentes de la sílaba, el uso de moras o niveles gradados

autosegmentales han contribuido particularmente a una mejor categorización y

60
representación de ambos segmentos. El acento y la escala de sonoridad sobresalen entre

los factores que afectan la resolución de hiatos, por lo que dedicamos las siguientes

páginas a su discusión.

2.5 Sonoridad y resolución de hiatos

De acuerdo con Harris (1983), definir una sílaba resulta complejo y problemático, ya que

aún con la ayuda de los espectrogramas, no se puede extraer una sílaba. Así, para

aproximarse a la realidad física de una sílaba se recurre a la noción de escala de

sonoridad. Dicha sonoridad se especifica según una escala universal. Aunque ya referida

arriba, aquí incluimos nuevamente la propuesta por Steriade (1982) por cuestión de

claridad.

Escala 10 9 8 7 6 5 4 3 2 1 .5

Segmentos a e,o i,u r l m,n s v,z,đ f,t b,d,g p,t,k

Esta escala, sin embargo, puede adaptarse dependiendo de la lengua en cuestión. Para

español, Núñez Cedeño y Morales-Front (1998: 170) sugieren la siguiente escala:

1. Vocales

2. Deslizadas

3. Líquidas

4. Nasales

5. Obstruyentes

61
Hualde (2005) propone la siguiente escala:

6 vocal baja a
5 vocales medias e, o
4 vocales altas i, u
3 líquidas l, (ʎ) r, ɾ
2 nasales m n ɲ
1 obstruyentes f β ð ɣ s x ʝ ʧ

Figura 16. Escala de sonoridad en español

Para Hualde (2005), las deslizadas pueden ser altas o medias y se ubican en los mismos

niveles que las vocales subyacentes correspondientes. Aunque en general estas escalas se

aceptan, todavía no hay una respuesta completa ni clara a la pregunta de qué es

sonoridad. Ladefoged (1993) define la sonoridad de un sonido como “[…] its loudness

relative to that of other sounds with the same length, stress, and pitch”. Parker (2002)

tuvo como objetivo identificar correlatos físicos cuantificables con la sonoridad

fonológica. Midió los correlatos de sonoridad en inglés y en español y encontró que la

intensidad es el más confiable mientras que la duración es el correlato más débil.

Jany et al. (2007) examinaron la universalidad de la base acústica para la jerarquía de

sonoridad en árabe egipcio, hindi, mongol y malayalam considerando la base acústica en

términos de intensidad. Concluyeron que excepto por el mongol, la siguiente escala

universal de sonoridad se mantiene: deslizadas > líquidas > nasales > obstruyentes. Las

vocales, asumimos, están al inicio de la escala antes de las deslizadas.

62
Jany et al (2007) argumentan que, basándose en la estructura interna de la sílaba, se

pueden encontrar evidencias fonológicas para la jerarquía de sonoridad a través del

Principio Secuencial de Sonoridad (Blevins, 1995; Clements, 1990; Harris, 1983), el

Mínimo de Distancia de Sonoridad (Selkrik, 1984; Steriade, 1982), del Principio de

Dispersión de Sonoridad (Clements, 1990, 1992), y el acento basado en sonoridad

(Bianco, 1996; de Lacy 1997, 2002).

En breve, el Principio Secuencial de Sonoridad establece que el núcleo silábico

constituye una cima de sonoridad, la cual es precedida o seguida por segmentos con

valores progresivamente decrecientes, determinados por la jerarquía de sonoridad. Esta

definición se corresponde con la Generalización de Sonoridad Secuencial de Selkirk

(1984). De acuerdo con Morelli (1999), esta idea la introdujeron mucho antes Sievers

(1881), Jespersen (1904), Sausurre (1914) y Grammont (1933). Más recientemente,

Hooper (1976), Kiparsky (1979), Steriade (1982), Selkirk (1984) y Clements (1990) han

contribuido a este principio.

El Principio de Mínimo de Distancia de Sonoridad fue introducido por Harris (1983) y

establece que los segmentos se combinan en base a su relativa distancia en la escala de

sonoridad. Algunas lenguas pueden requerir una distancia menor o mayor entre un sonido

y los sonidos adyacentes. Este principio complementa en algunas lenguas el Principio

Secuencial de Sonoridad.

Para Clements (1990), hay dispersión de sonoridad en la sílaba cuando la máxima

sonoridad recae en la demisílaba inicial (ataque) y la mínima sonoridad se localiza en la

demisílaba final (coda); es decir, la combinación preferida es aquélla que implica un claro

63
y constante incremento de sonoridad en el ataque y un mínimo decremento en la coda

(con la secuencia CV sin decremento, por supuesto).

Clements (2005:5) menciona estos otros principios de silabificación basados en

sonoridad:

Alineación sonoridad-silabicidad: la cima de sonoridad se corresponde con las

cima de la sílaba y vice-versa.

Contacto silábico: la sonoridad baja a su nivel máximo a través de los lindes

silábicos.

Retomando el tema de hiato en español, se observa que la secuencia de vocales puede ser

de sonoridad creciente, sonoridad decreciente y sonoridad constante (sound plateau en

inglés). Con sonoridad creciente, la V1 tiene un nivel menor de sonoridad que la V2,

según lo dicta la escala de sonoridad; con la sonoridad decreciente, la V2 es menor en la

escala de sonoridad que la V1; y con la sonoridad constante, ambas vocales comparten el

mismo nivel de sonoridad. Veamos estas secuencias hiáticas ilustradas junto con

secuencias diptongadas en las mismas o similares palabras para observar que la misma

sonoridad creciente o decreciente permanece cuando se resuelve el hiato:

Sonoridad creciente

Hiato: frío [fɾí.o] María [ma.ɾí.a] Gúa [gú.a]

perpetúa [peɾ.pe.tú.a] almohada [al.mo.áða] teatro [te.á.tɾo]

64
Diptongo: friolento [fɾjo.lén.to] Mariana [ma.ɾjá.na]

Guatemala [gwa.te.má.la] perpetuar [peɾ. pe.twáɾ]

[al.mo̯á.ða] [al.mwá. ða] teatro [te̯a.tɾo] o [tja. tɾo]

Sonoridad decreciente

Hiato: aúlla [a.ú.ʝa] país [pa.ís] oír [o.íɾ]

Diptongo: aullando [aw.ʝándo] paisano [paj.sá.no] oigo [ój. ɣo]

En español, los hiatos con secuencias que producen una sonoridad constante son también

comunes; sin embargo, cuando el hiato se resuelve (mediante otra estrategia que no sea

heterosilabificación), la sílaba resultante en muchos casos no produce la misma sonoridad

constante que la secuencia original; es decir, la sonoridad se altera para satisfacer los

principios de Sonoridad Secuencial y de Dispersión de Sonoridad. Los siguientes

ejemplos ilustran esto:

Sonoridad constante

Hiato: poseer [po.se.éɾ] alcohol [al.ko.ól]

azahar [a.sa.áɾ] moho [mó.o]

pateé [pa.te.é] acordeón [a.koɾ. ðe.ón] poeta [po.e.ta]

Elisión: poseer [po.séɾ] alcohol [al.kól] azahar [a.sáɾ]

moho [mó] pateé [pa.té]

65
Diptongación con deslizadas medias o altas:

pateé [pa.tjé] acordeón [a.koɾ. ðe̯ón] o [a.koɾ. ðjón]

poeta [po̯e.ta] o [pwe.ta]

Epéntesis consonántica:

moho [mo.xo]

Con los ejemplos de arriba, particularmente con las secuencias de vocales medias en

contacto, puede refutarse este argumento de cambio de sonoridad dependiendo de la

escala jerárquica de sonoridad propuesta. Si nos basamos en la de Hualde (2005), pues no

hay cambio de sonoridad dado que las deslizadas se ubican en la misma escala que las

vocales subyacentes. Sin embargo, para Núñez Cedeño y Morales-Front (1998) las

deslizadas en español están un nivel debajo de las vocales, lo que coincide también con la

escala de Jany et al (2007), y esto apoya el cambio de sonoridad que sugerimos aquí.

Además del cambio de nivel de sonoridad, en las sílabas resultantes se obedecen los

principios de Sonoridad Secuencial y el de Dispersión de Sonoridad.

No obstante lo anterior, esto no implica que la selección de una u otra estrategia sea

arbitraria. Como arriba se ejemplificó, algunas palabras se resuelven generalmente con

sólo una estrategia, mientras otras se resuelven de diferentes maneras. Esto es

precisamente lo que conlleva a la variación existente. La pregunta entonces es cuándo se

prefiere una estrategia a otras. Bakovic (2007), al respecto, señala que un factor que

influye en la selección de una u otra estrategia en la resolución de hiato es el rechazo a

elementos idénticos adyacentes, pues estos elementos idénticos con frecuencia se evitan o

reparan por medio de diferentes procesos fonológicos (McCarthy 1986, Borowsky 1987,

66
Yip 1988 citado por Bakovic). Como se puede observar en los ejemplos de arriba, estos

procesos pueden ser elisión, diptongación o epéntesis consonántica.

En cuanto a elisión, Martínez-Gil (2000), en su análisis de secuencias vocálicas en lindes

de palabras en el español chicano, afirma que las vocales idénticas se contraen en una.

En consonancia con esto, Jenkins (1999) encontró que los grupos vocálicos idénticos en

lindes postléxicos se fusionan en una sola vocal, y él llama a este proceso fusión. Su

explicación del proceso la fundamenta en la “Twin Sister Convention” (Clements and

Kaiser, 1983), la cual prohíbe valores de rasgos idénticos adyacentes en una unidad que

soporta un solo rasgo; es decir, ‘las hermanas gemelas’ se degeminan simplificando así la

secuencia de dos vocales en una. El Principio de Contorno Obligatorio también se utiliza

en la explicación, ya que éste indica que los elementos idénticos adyacentes no pueden

coexistir en el output.

Otra explicación frecuentemente considerada para la elisión de segmentos se basa en el

principio del menor esfuerzo, el cual implica el mínimo esfuerzo articulatorio necesario

para mantener la inteligibilidad (Véase Kirchner,1998; 2001; 2004). Kirchner (1998)

señala que el principio fonético del mínimos esfuerzo puede expresarse formalmente en

el marco de la Teoría de la Optimidad como una restricción universal, la cual puede ser

violada en algunas lenguas por los conflictos entre las restricciones que se presenten. Este

autor propone particularmente que el proceso de lenición (la elisión incluida aquí como el

proceso extremo) está motivado por un imperativo fonético: el mínimo esfuerzo

articulatorio.

67
Mientras que las explicaciones de Jenkins y Martínez-Gil abordan el hiato en el nivel

postléxico, la presente disertación se concentra en secuencias a nivel léxico y por ello el

tipo de palabra en cuestión es crucial. Tomando como base la noción de sonoridad,

nuestra hipótesis es que se preferirá la elisión a otras estrategias cuando el hiato esté

compuesto de dos vocales idénticas en el nivel léxico. Sin embargo, cuando este grupo

vocálico es el resultado de procesos morfológicos como conjugación o derivación, existe

la posibilidad de escoger diptongación con deslizada media o deslizada alta. Esto

significa, en consecuencia, que no todas las palabras que incluyan una secuencia de

vocales idénticas resolverán el hiato por medio de elisión; hay un grupo de palabras

derivadas que están morfológicamente relacionadas las cuales usan diptongación y, por

analogía, resuelven el hiato con esta estrategia. La variación que observamos es el caso

de las formas verbales como pateé [pa.te.é], la cual tiene una secuencia de vocales

idénticas, producto de conjugación, pues es el tiempo pasado del verbo patear para la

primera persona de singular:

Verbo: patear

Base: pate-

Tiempo pasado primera persona singular: é

Nuestra hipótesis es que algunos hablantes que resuelven el hiato en este tipo de verbos

con elisión lo hacen siguiendo reglas del Principio Secuencial de Sonoridad, la

Convención de Hermanas Gemelas y el principio del menor esfuerzo. Lo que consideran

para resolver el hiato de esta manera es solamente el marco donde dos vocales idénticas

coinciden. Es decir, estos hablantes se constriñen solamente por reglas fonológicas, por la

68
estructura compuesta de dos vocales similares, justo como hacen con otras palabras

donde se observa el mismo patrón: alcohol, poseer, leer, etc.

Sin embargo, hay otros hablantes que usan la diptongación con deslizada media o alta en

lugar de elisión para resolver el hiato. Esta preferencia, sugerimos, se basa en principios

fonológicos y relaciones morfológicas con palabras similares cuyas secuencias vocálicas

también se diptongan o integran diptongos derivados. Lo que parece ocurrir es que

‘pateé’ es una palabra paradigmáticamente relacionada con el verbo ‘patear’, y los

hablantes que resuelven el verbo en infinitivo u otras formas conjugadas con

diptongación, harán lo mismo con ‘pateé’ por analogía. Al hacerlo, mantienen todas las

vocales o espacios de vocoides -aunque la V1 se vuelve deslizada alta- y respetan los

principios de sonoridad y del mínimo esfuerzo. Incluso, parece ser que en verbos no

necesariamente –ear, pero que incluyen la secuencia vocálica e + vocal en sus formas,

también pueden presentarse estos diptongos. Por ejemplo, con formas como “veamos”,

“leamos”, etc., también es probable que surjan diptongos con media y con alta, aunque

con ésta última estas producciones se asocian generalmente con gente de nivel educativo

muy bajo o de áreas rurales.

La selección entre hacer la V1 una deslizada media o alta parece depender de la escala de

sonoridad y el Principio de mínimo de distancia de sonoridad. Aquellos hablantes que

prefieran una distancia mayor entre un sonido y el sonido adyacente en la escala de

sonoridad diptongarán con una deslizada alta; y aquellos hablantes que escojan una

menor distancia entre los sonidos involucrados en la secuencia seleccionarán la deslizada

media. Por ejemplo, consideremos el infinitivo ‘patear’. El resultado después de resolver

el hiato con diptongación puede ser [pa.te̯aɾ] o [pa.tjaɾ]; la primera secuencia tiene

69
solamente un nivel o grado de diferencia en la escala de sonoridad, mientras que el

segundo resultado presenta dos niveles de diferencia. Esta variación con este fenómeno

puede encontrar explicaciones en bases sociales. Esta relación o efecto de los factores

sociales en el uso de una u otra estrategia se analizará en el capítulo cuatro.

La epéntesis consonántica también se usa en la resolución de hiatos cuando la preferencia

es mantener sílabas atendiendo los principios de Sonoridad Secuencial y de Dispersión de

Sonoridad. El ejemplo ofrecido aquí es ‘moho’ en el que se inserta la consonante [x]

entre las vocales. Esto se ha escuchado en la Península de Yucatán, pero no es común. La

estrategia más empleada es la elisión. Esto puede explicarse en términos del principio del

menor esfuerzo, pues ambas estrategias, elisión y epéntesis consonántica, respetan los

principios de sonoridad; o en términos de variación basada en otros factores lingüísticos o

sociales. Los factores sociales, precisamente, pueden explicar también otros casos de

resolución de hiato. Discutiremos esto en el capítulo tres. A continuación, abordaremos el

acento, otro tema interno crucial en el fenómeno de la resolución de hiatos.

2.6 Acento y resolución de hiato

De acuerdo con Hualde (2005: 220), “[…] stress is the degree of relative prominence that

a syllable receives in comparison with the other syllables in a given domain.” Agrega que

en el dominio de la palabra, sólo una sílaba puede recibir acento primario. Considerando

algunos correlatos fonéticos del acento, Contreras (1964) (citado por Montero, 2007)

condujo experimentos examinando la duración, intensidad y ‘pitch’ o ƒ0 (frecuencia

fundamental) del acento en español y concluyó que el ‘pitch’ es el correlato más

importante. Solé Sabater (1985) coincide con Contreras en que el ‘pitch’ es el correlato

70
más importante del acento, seguido de duración. La intensidad parece no desempeñar un

papel relevante. Por su parte, Llisterri et al. (2004) concuerdan también en que ƒ0

(frecuencia fundamental) es el correlato más decisivo en la percepción del acento.

Montero (2007) en su estudio sobre la percepción de los correlatos acústicos del acento

en inglés, francés y español, encontró que ƒ0 es el mejor indicador, seguido de intensidad

y después de la duración. Finalmente, Cabré y Prieto (2007) afirman que las secuencias

acentuadas son las más largas en todas las lenguas.

En español, el acento es fonológicamente contrastivo; es decir, que tiene una función

distintiva, pues palabras idénticas pueden recibir el acento en diferente posición y

conllevar así significados diferentes, tal como ocurre en público, publico y publicó, que

siendo la misma palabra, la primera recibe el acento en la tercera sílaba, la segunda en la

segunda, y la tercera en la última sílaba y sus significados son distintos. Esta posibilidad

del acento de cambiar de posición, sin embargo, no es totalmente libre; ésta está limitada

a las últimas tres sílabas de la palabra (a lo que Harris, 1983 llamó la ventana silábica).

Así, dependiendo de la posición del acento en cualquiera de estas tres últimas sílabas, las

palabras se clasifican en oxítonas, cuando la última sílaba es la acentuada; paroxítonas,

cuando la penúltima es la tónica; y proparoxítonas, cuando la antepenúltima recibe el

acento. Veamos los siguientes ejemplos:

Oxítonas

[le.ón] [pa.ís] [bol. βéɾ]

Paroxítonas

[rí.o] [lé.o] [bú.o]

71
Proparoxítonas7

[a.é.re.o] [te.lé.fo.no] [mo.men.tá.ne.o]

No obstante esta generalización, Ohanessian (2004) y Hualde (2005) afirman que la

asignación del acento es diferente cuando se trata de verbos o adjetivos. Dado que

nuestro interés en este estudio son las conjugaciones de los verbos –ear y éstas no

presentan variaciones o irregularidades en la asignación del acento, no ahondaremos en

las distinciones mencionadas.

2.6.1 La función del acento en la resolución de hiato

En estudios recientes sobre la lengua española, se ha identificado el acento como uno de

los factores más determinantes en la resolución del hiato (Ver Sanicky, 1989; Jenkins,

1999; Aguilar, 1999, 2006; Alba, 2005, 2006; Morris, 1998; y Martínez-Gil, 2000).

Senturia (1998) sostiene que ‘hiatus appears when a sequence of two vocoids rising or

falling in sonority is stressed on the less sonorous vocoid, or when the vocoid sequence is

of equal sonority’ (p 182). Asimismo, Rosenthall (1994) considera el acento como un

factor crucial en la formación de hiato, pues señala que un vocoide alto acentuado

conforma un hiato cuando aparece adyacente a una vocal no alta, pero un vocoide alto

átono es tautosilábico con la vocal adyacente. En algunos dialectos, sin embargo, esta

afirmación no puede sostenerse.

7
En español mexicano, aéreo y momentáneo se pronuncian generalmente como paroxítonas, diptongando la secuencia
[e.o]. Resulta interesante observar que estas palabras mantienen una marca ortográfica del acento siguiendo la regla que
declara que todas las palabras proparoxítonas deben ser tildadas ortográficamente, lo cual significa que dichas
secuencias deben silabificarse como heterosilábicas de acuerdo con la pronunciación prescrita.

72
Chitoran y Hualde (2007) y Face y Alvord (2004) llaman ‘hiatos excepcionales’ a las

secuencias de vocal alta átona contigua a otra vocal [iV] pronunciadas en sílabas

diferentes, aunque reconocen que la tendencia, tal como lo prescribe la gramática

tradicional, es a formar diptongo [jV]. Por ejemplo, ‘piano’ puede pronunciarse como

[pja.no] o [pi.a.no] en español peninsular. El último es un hiato excepcional y esta

variación se observa solamente cuando el vocoide alto es átono.

Aguilar (2006) también encontró que el acento desempeña una función primordial para

resolver hiatos. Considerando las estrategias de heterosilabificación o hiato como ella le

llama, diptongación (ella dice reducción) y elisión, encontró diferencias para la secuencia

/a e/ de acuerdo al patrón acentual en cuestión. En su estudio de hiato en el nivel

postléxico en español peninsular, Aguilar encontró que dos vocales átonas adyacentes

favorecen la elisión (45%), pero si V1 es tónica y V2 es átona, se prefiere la diptongación

(49%); y si V1 es átona y V2 es tónica, o ambas son tónicas, entonces la tendencia es

producir hiatos (87% y 91%, respectivamente).

Similarmente, Alba (2006), considerando los cuatro posibles patrones acentuales en una

secuencia vocálica entre palabras en el español de Nuevo México, encontró que el

contexto que favorece la resolución de hiato (que no sea el mantenimiento del mismo) es

aquél en el que ambas vocales son átonas (83%). Por el contrario, cuando las dos vocales

reciben acento, el hiato se resuelve sólo 13% de las veces. Cuando al menos una de las

dos vocales es átona, el hiato se mantiene 50% de las veces.

Un fenómeno interesante relacionado con acento y resolución de hiato es la dislocación

acentual. Mientras que Jenkins (1999) encontró en su estudio del español de Nuevo

73
México que los elementos acentuados nunca se alteran en la resolución a nivel de lindes

de palabras a menos que estén adyacentes a otro elemento tónico, Martínez-Gil (2000)

afirma que en español chicano siempre es la V1 (excepto /a/) la que se vuelve deslizada

junto a otra vocal. Esto implica que debe perder su silabicidad y el acento debe dislocarse

a la V2. Por ejemplo, Pasé horas  [pa.sjó. ɾas]. Comparando con el español mexicano,

el autor señala que en éste la tendencia es también a hacer la V1 una deslizada, sin

embargo, esto ocurre sólo cuando la vocal es átona; es decir, las vocales tónicas tienden a

mantener siempre su carácter nuclear. No obstante, Hualde (1995) ofrece algunos

ejemplos de cambio acentual en México: ma.íz  [májs]; ma.estro  [májs.tro].

Finalmente, en español peninsular, el autor destaca que la pérdida de silabicidad está

determinada principalmente por la sonoridad de los elementos implicados: la vocal

menos sonora según la escala de sonoridad será la más proclive a perder silabicidad sin

importar su posición en la secuencia y el acento se trasladará a la más sonora.

Con esta breve revisión del acento, podemos notar que indudablemente éste desempeña

un papel fundamental en la resolución de hiatos, pero no solamente eso, pues en realidad

el acento parece ser uno de los factores determinantes de la variación observada en la

resolución de hiatos en los diferentes dialectos del español.

Hasta aquí se ha presentado una revisión de la literatura de los estudios más relevantes y

recientes sobre la resolución de hiato, poniendo especial énfasis en los trabajos realizados

sobre el español y se discutió la variación observada. Por el creciente número de

investigaciones en la pasada década y actualmente, es notorio el interés en este tema

desde diferentes enfoques y perspectivas. Sin embargo, los estudios descriptivos son

indudablemente más abundantes, aunque los estudios experimentales han empezado a

74
hacer presencia en el mundo académico. Adicionalmente, en este capítulo se definieron y

describieron algunos conceptos, nociones y propuestas teóricas indispensables; se

presentaron algunas clasificaciones de estrategias de resolución y se abordaron los

factores internos y externos identificados en la literatura con la finalidad de contar con los

elementos teóricos suficientes para la discusión y análisis del fenómeno de la resolución

de hiatos en español en el capítulo cuatro.

Este apartado ofrece así una visión general de los avances y alcances de la investigación

sobre la resolución de hiatos en español, lo que nos ha permitido al mismo tiempo definir

hipótesis y perfilar la metodología de esta tesis: una combinación de teoría y metodología

variacionista y un enfoque fonético experimental. Dedicamos, por tanto, el siguiente

capítulo a presentar y discutir con detalle la metodología a seguir en esta tesis.

75
Capítulo 3: Método, variables e hipótesis

3.1 Teoría de la variación y metodología variacionista

En la investigación sociolingüística se observan generalmente dos enfoques: la

investigación cualitativa (etnografía de la comunicación, análisis del discurso) y la

investigación cuantitativa (variación y cambio lingüístico). La investigación

variacionista, con William Labov como su pionero, surge como un paradigma

cuantitativo dentro de la sociolingüística. Este tipo de investigaciones refuta el axioma de

categoricidad (Chambers, 2003), el cual asume que la estructura lingüística debe tratarse

como invariable. De ahí se deriva el principio de Weinreich, Labov, and Herzog (1968)

de que todos los sistemas lingüísticos muestran variación y que ésta es una propiedad

esencial que cubre funciones sociales importantes y permite un cambio lingüístico

ordenado. Para los variacionistas, por tanto, la variación es la parte central de la

investigación. La principal presuposición de los variacionistas es que la variación es

estructurada y, por tanto, se intenta descubrir los patrones que sigue dicha variación.

Weinreich et al., (1968:100) se refieren a esta noción como “heterogeneidad ordenada”, y

significa que la variación que observamos no es libre o azarosa, sino que sigue

determinados patrones. La tarea del variacionista es descubrir los patrones y

características de este sistema complejo. .

76
Por otra parte, el enfoque variacionista surge en contra de la dicotomía saussuriana que

separa los estudios sincrónicos de los estudios diacrónicos del cambio lingüístico. De

hecho, Tagliamonte (2006) sugiere que la mayor motivación para el desarrollo de este

enfoque era presentar un modelo de la lengua que pudiera acomodar las paradojas del

cambio lingüístico. Es sabido por todos que las lenguas están en constante cambio. Si

aceptamos la afirmación de Weinreich et al (1968) de que “no toda variación y

heterogeneidad involucra un cambio, pero que todo cambio involucra variación y

heterogeniedad”8, estudiar la variación lingüística nos llevaría a descubrir los cambios

incipientes, en curso o concluidos que se dan o se han dado en una lengua, integrando

estudios sincrónicos y diacrónicos.

Los análisis variacionistas toman como punto de partida la estructura lingüística de una

determinada lengua y estudian su realidad de uso en el contexto social atendiendo

factores sociales e internos de la lengua. La tarea de los variacionistas es esencialmente el

estudio de la relación entre variación, significado social y la evolución y desarrollo del

mismo sistema (cfr. Tagliamonte, 2006). La intención es determinar las constricciones

lingüísticas y los factores sociales que ejercen un efecto en el comportamiento lingüístico

de los hablantes. La edad, el sexo y la clase social son algunos de los principales factores

sociales incluidos en estudios variacionistas. Éstos varían dependiendo del contexto

social de los hablantes en cuestión.

Otra característica particular de los estudios variacionistas es que, al igual que todo

estudio sociolingüístico, la recolección de datos se basa, siguiendo a Johnstone (2000), en

8
Traducción propia.

77
observaciones de las personas usando la lengua, y en el análisis de esas observaciones. Es

decir, se considera que para analizar el comportamiento lingüístico debemos basarnos en

datos empíricos, a través de la observación del uso real de la lengua, y no en datos

construidos a partir de la introspección o de la especulación. El objetivo de la

metodología variacionista es accesar a la lengua vernácula de los sujetos, entendiéndose

ésta, según Labov (1972b: 208) como “the style in which the minimum attention is given

to the monitoring of speech”. Chambers (2003) se refiere a ésta como “estilo casual”; y

Milroy (1992), como “lengua real en uso”.

Dado que nuestro objetivo es analizar el fenómeno de la resolución de hiato en los verbos

–ear del español mexicano, hacerlo desde una perspectiva teórica y metodológicamente

variacionista parece ser el camino idóneo para alcanzarlo, pues la integración en el

análisis de factores lingüísticos y sociales nos permitirá tener una visión integral y

completa del fenómeno. Ésta es precisamente una limitante de trabajos previos que no

han mantenido un balance entre lo meramente estructural y lo social.

Cabe aclarar, no obstante, que una limitante de usar la metodología variacionista es que la

búsqueda de la lengua vernácula y de los datos de interés implica mucho tiempo y en

muchas ocasiones el número de ocurrencias o frecuencias de los datos en cuestión resulta

insuficiente para un análisis estadístico9. Por tanto, para salvar este obstáculo, para este

estudio decidimos conjuntar la teoría y metodología variacionista con un método fonético

experimental, el cual presentamos a continuación.

9
En un estudio piloto que realicé utilizando sólo la entrevista sociolingüística, el número de frecuencias fue
insuficiente para el análisis cuantitativo.

78
3.2 Método experimental

Con el propósito de contar con suficientes datos confiables que nos ayuden a comprobar

nuestras hipótesis y a ofrecer un análisis más objetivo y preciso del fenómeno de la

resolución de hiatos en los verbos –ear en español mexicano, se optó por una

complementariedad de metodologías: la variacionista, por un lado, y por el otro, un

enfoque experimental. Éste último es frecuentemente empleado en estudios fonéticos, los

que se distinguen de los tradicionales por el uso de instrumentos de laboratorio y por un

diseño de investigación experimental. Sampieri et al (2006) señala que “los experimentos

manipulan tratamientos, estímulos, influencias o intervenciones […] para observar sus

efectos sobre otras variables […] en una situación de control” (p. 160). De esta manera,

las pruebas o tareas en estudios fonéticos se vuelven una situación de control donde se

manipulan intencionalmente una o más variables independientes. Los paquetes de

software para manipulación de sonidos y análisis acústicos, así como el equipo de

grabación y otros instrumentos de laboratorio fonético se han constituido como

herramientas indispensables para el diseño de los experimentos y el análisis de los datos.

Recientemente ha habido un creciente interés y desarrollo de investigaciones en el campo

de la fonética experimental. En el caso concreto de estudios sobre secuencias vocálicas,

Aguilar, 1999; Hualde y Prieto, 2002; Face y Alvord, 2004; Aguilar, 2005 y 2006;

Garrido, 2007; Hualde y Chitoran, 2007; Hualde et al., 2008, han contribuido a la

discusión ofreciendo resultados confiables y descripciones más precisas bajo un método

fonético experimental. Partiendo de esta combinación de metodologías, planteamos el

presente trabajo como un estudio sociofonético de la resolución de hiato en los verbos ear

79
del español mexicano, en el que se presenta la intersección de la sociolingüística

variacionista con la fonética experimental.

En la sección de instrumentos y procedimientos que se presenta posteriormente se

describen las pruebas que se usaron en esta investigación, así como la entrevista

sociolingüística. También se discute su implementación y formas de análisis.

3.3 Definición de variables

3.3.1 Variable lingüística dependiente y sus variantes

A través de la experiencia con la comunidad de habla en Chetumal, México (nuestra

población de interés), hemos identificado variación en la producción del grupo vocálico

de los verbos –ear en sus formas verbales finitas y no finitas. Aunque las estrategias de

resolución reportadas en la literatura sobre el español pueden ser muy diversas, este

estudio se enfocará en: mantenimiento del hiato, formación de diptongo con deslizada

media [], formación de diptongo con deslizada alta [j], y elisión, dada la experiencia en

la comunidad de habla y las intuiciones propias que se tienen sobre este dialecto. De

manera gráfica tenemos lo siguiente:

Variable lingüística dependiente /e V10/

Variantes eV  V jV V

Figura 17. La variable linguística y sus variantes

10
V representa aquí cualquier vocal

80
3.3.2 Las variables lingüísticas independientes

De acuerdo con la literatura en torno a la resolución de hiatos, la estructura silábica, el

acento, y las deslizadas, se han identificado los siguientes factores internos que pueden

condicionar la variación existente de nuestra variable: e + V en verbos -ear.

Calidad de la vocal siguiente

En el grupo e + V, tenemos que la vocal siguiente en las formas verbales finitas y no

finitas puede ser solamente [a], [e], [o]. En la literatura se sugiere, por ejemplo, que

cuando tenemos dos vocales idénticas, una se elide. Nuestra propuesta es que ésta no es

la tendencia general en el caso de los verbos -ear, sino que los hablantes recurren más a

la estrategia de diptongación.

El acento

Acento en relación con la V1 o V2 o con la vocal de otra sílaba (VSS)11

En las conjugaciones de los verbos –ear identificamos tres patrones acentuales: la V1 es

tónica y la V2 es átona; la V2 es tónica y la V1 es átona; o ambas son átonas y el acento

recae en otra sílaba. Por ejemplo, en presente de primera persona [pa.sé.o] la V1 recibe el

acento prosódico; en pretérito de tercera persona [pa.se.ó] la V2 es la acentuada; y en las

formas de futuro [pa.se.a.ré], ninguna recibe el acento prosódico.

En concordancia con estudios previos, nuestra hipótesis es que el acento es la principal

condicionante lingüística que favorece el mantenimiento del hiato, puesto que las vocales

que reciben acento son más resistentes a los cambios. En contraste, en el caso que el

11
Vocal de la sílaba siguiente.

81
acento recae en una sílaba que no es la del grupo vocálico que conforma el hiato, como

en la mayoría de las formas de futuro [pa.se.a.ré], [pa.se.a.rás], [pa.se.a rá],

[pa.se.a.ré.mos] [pa.se.a.rán], hay una gran probabilidad de formación de diptongos. Una

hipótesis complementaria es que la traslación o dislocación acentual en español mexicano

no es favorecida, y esto inhibe también la formación de diptongos.

Sonoridad de las vocales en contacto

En el caso específico de las formas finitas y no finitas de los verbos –ear, tenemos

ejemplos de sonoridad creciente y de sonoridad constante (sound plateu en inglés). Así,

en [ba.té.a] y [ba.te.a.rá] tenemos sonoridad creciente dado que la [e] es de menor

sonoridad, según la escala de sonoridad, que la [a]. Por otra parte, en [ba.té.o],[ [ba.te.ó] y

[ba.té.e] tenemos sonoridad constante pues las vocales medias comparten el mismo grado

de sonoridad. Sin embargo, retomando la revisión de la literatura, tenemos que el

principio secuencial de sonoridad (Blevins, 1995; Clements, 1990; Harris, 1983), el

principio de mínimo de distancia de sonoridad (Selkrik, 1984; Steriade, 1982), y el

principio de dispersión de sonoridad (Clements, 1990, 1992) implican una estructura

silábica con sonoridad creciente. Asimismo, según Bakovic (2007), existe un rechazo a

elementos idénticos adyacentes, pues estos elementos idénticos con frecuencia se evitan o

reparan por medio de diferentes procesos fonológicos (McCarthy 1986, Borowsky 1987,

Yip 1988 citado por Bakovic). Por lo anterior, en español mexicano, es nuestra hipótesis,

hay una tendencia a evitar secuencias vocálicas con sonoridad constante; es decir, se

prefiere una secuencia vocálica cuyos elementos se distingan lo más posible en cuanto a

sonoridad.

82
Tipo de sílaba

Una de las condiciones de resolución de hiato identificada en la literatura es el tipo de

sílaba. Por ello, para este estudio también consideramos esta variable factor con sus dos

subfactores: sílaba abierta [pa.te.ó], o cerrada [pa.te.as.te]. La hipótesis con esta variable

es que las sílabas cerradas favorecen la resolución del hiato por medio de otra estrategia

que no sea la retención.

3.3.3 Variables externas independientes

Instrumento de recolección de datos

En este estudio se incluye la variable instrumento de recolección de datos en relación con

la distinción que estudios previos sobre resolución de hiato hacen del estilo, limitado por

algunos a la velocidad del habla y por otros a grados de formalidad en el habla, y que ha

sido una de las condicionantes más aludidas. Aquí utilizamos tres instrumentos de

recolección de datos: entrevista sociolingüística, prueba de transformación y prueba de

reconstrucción fonética. Con la primera, se presupone que la lengua de los informantes es

espontánea y con una velocidad más natural; con las pruebas, la producción del

informante es totalmente dirigida por lo que su monitoreo o grado de atención hacia la

lengua misma es mayor y su velocidad es menor. En una prueba el sujeto debe leer y en

la otra escuchar y repetir. Por ello, consideramos como variable el tipo de instrumento

usado y como subfactores la entrevista, la prueba de transformación y la prueba de

reconstrucción fonética.

83
Considerando que en la literatura se distinguen los hiatos generalmente de los diptongos

por su duración (los primeros con mayor duración que los últimos) y que se considera la

velocidad como una variable que afecta la producción de hiatos y diptongos; es decir, que

a mayor velocidad en el habla, mayor tendencia a producir diptongos, presuponemos que

la entrevista motivará mayor número de diptongos. No obstante, también se ha dicho que

la velocidad sólo provoca duraciones más breves para ambos hiatos y diptongos, pero no

una mayor producción de los últimos. Por otra parte, las pruebas, por tratarse de lectura

de enunciados o repetición del algo escuchado, probablemente arrojen palabras que

registren duraciones mayores tanto en hiatos o diptongos en comparación con la

entrevista, o que con un mayor monitoreo los informantes produzcan más hiatos.

Cualquiera que sea el caso, el instrumento puede ser un factor condicionante también de

la resolución de hiatos, como se ha visto también en estudios previos.

Edad

Si aceptamos la afirmación de Weinreich de que no toda variación involucra un cambio,

pero que todo cambio, generado por la comunidad de habla, involucra variación, estamos

obligados a identificar en primera instancia si se trata de un cambio. Para ello, un estudio

en tiempo aparente se vuelve indispensable. Es decir, agrupamos a los informantes por

edades diferentes y tratamos de ver si hay una distribución de la variable lingüística por

niveles de edad. Atendiendo los hallazgos recientes de Vuskovich (2006) en los que la

gente mayor produce más hiatos que los jóvenes, nuestra hipótesis es que estamos ante un

cambio en curso en el que los grupos más jóvenes favorecen la resolución del hiato con

estrategias diferentes a la heterosilabificación.

84
Para integrar los grupos etarios consideramos principalmente la relación edad y nivel

educativo que se da en México y lo observado en la comunidad de habla de interés, pues

generalmente la gente forma redes de contacto más cercanas con las personas de su

misma edad, ya sea de su nivel educativo o de su trabajo. Así, por ejemplo, un joven de

20 años va a relacionarse con otros universitarios si él es también estudiante, o con otros

jóvenes trabajadores de aproximadamente su misma edad si él ya ha incursionado en el

mundo laboral. Para esta investigación tenemos los siguientes cuatro grupos que

justificamos de la siguiente manera:

El primer grupo etario: 18-24 se corresponde con la gente que está en la universidad o

que egresó de secundaria o la preparatoria y que recientemente se ha incorporado a un

trabajo12. Por no tener ninguna calificación profesional, la mayoría de estos jóvenes se

dedica a trabajos como cajeros, meseros, dependientes, vendedores, comerciantes, entre

otros. Muchos, generalmente, están en su primer trabajo y sus puestos son temporales o

de nivel jerárquico bajo. Obviamente, hay excepciones. En las clases altas los jóvenes

que por alguna razón dejan la escuela pueden dedicarse a viajar o hacer cosas ociosas, o

trabajar con sus padres en sus negocios percibiendo buenos salarios. En este grupo puede

haber mujeres casadas que se dedican solamente a su casa y al cuidado de los niños, o

que trabajan esporádicamente. Algunas mujeres amas de casa se dedican a la venta de

productos de catálogos entre sus amigos, famliares y vecinos colaborando así al ingreso

de la familia. Las mujeres con más posibilidades económicas sólo se dedican al hogar.

12
En México, actualmente la primaria y secundaria son obligatorias.

85
El segundo grupo, de 25 a 35, lo conforman en cierto porcentaje personas con algún

título universitario que continúan estudiando algún posgrado o que se han iniciado en el

mundo del trabajo profesional. Muchos, aunque trabajan como profesionistas,

generalmente reciben salarios bajos y sus puestos son también de nivel bajo por su falta

de experiencia. Las personas con nivel de primaria a bachillerato se dedican a trabajos

donde la juventud, la experiencia y determinada capacitación laboral son valoradas. Estas

personas tienen niveles medios en la jerarquía laboral, generalmente. En este grupo

también podemos encontrar amas de casa en situaciones similares señaladas en el grupo

previo.

El tercer grupo 36-55 se corresponde en general con personas con experiencia en su

trabajo y con un nivel mayor en la empresa o lugar de trabajo. Muchos son jefes o

responsables de área, altos ejecutivos y directivos; perciben mejores salarios que los

inexpertos que se inician. Por ejemplo, un albañil en este rango de edad es “maestro”

albañil o el responsable de construcción y tiene a su cargo a otros subordinados. Esto

ocurre con frecuencia en relación con la experiencia, los años de entrenamiento o

capacitación, el desarrollo de habilidades diferentes y porque la gente a esta edad

mantiene o busca una vida estable y se preocupa por recibir un mejor salario y satisfacer

la necesidad de autorrealización. También en este grupo hay personas que pueden estar

trabajando y estudiando al mismo tiempo. Hay también personas que han conseguido

algún trabajo permanente y se dedican a éste sin ninguna otra pretensión. Mujeres amas

de casa también se encuentran en este grupo.

El último grupo de 56-65 años está integrado por personas que se mantienen en su trabajo

con el máximo nivel que alcanzaron, pero ya no hay muchos en puestos de directivos o

86
jefes. Generalmente, ya hacen trabajos que requieren menos esfuerzo. Algunos prefieren

independizarse y trabajar por su cuenta con algún negocio propio. Algunos ya están

jubilados.

Estas clasificaciones se hicieron entonces considerando las fases de la vida de los

mexicanos en general, pero, por supuesto, esto no es categórico. Hay excepciones, sobre

todo en las personas de niveles socioeconómicos altos y bajos. Los privilegios corruptos

y el desempleo, por ejemplo, pueden ser razones para que haya desfases en la

clasificación seleccionada.

Sexo

Como en todo estudio variacionista, la variación entre hombres y mujeres no puede

dejarse a un lado. Dado que en algunos estudios sociolingüísticos previos (Perissinotto,

1975; Vuskovich, 2006) se han identificado algunas diferencias entre hombres y mujeres

con respecto a la producción de hiatos, pero no han sido concluyentes, en este estudio no

postulamos hipótesis alguna al respecto. Sin embargo, pueden encontrarse datos que

apoyen o rechacen las ideas vigentes.

Nivel educativo

En México, de acuerdo con las estadísticas del Instituto Nacional de Estadística,

Geografía e Informática (INEGI), el índice de alfabetismo en México en el 2005 fue de

91.6%. Sin embargo, en Quintana Roo, en ese mismo año sólo el 58.6% de la población

de 15 años en adelante contaba con nivel educativo básico (primaria y secundaria); el

16.9% tenía el nivel medio superior (bachillerato); y el 14.3% había realizado estudios de

educación superior (licenciatura). No se incluyó en el reporte la población con posgrado.

87
Estas cifras muestran de alguna manera la composición social del Estado, pues el nivel

educativo es un indicador de estatus socioeconómico en México. La clase trabajadora

generalmente cuenta sólo con primaria y secundaria; la clase media baja con bachillerato

y algunos con universidad; la clase media con estudios universitarios y de posgrado,

aunque puede haber algunos con bachillerato; y la clase alta, bachillerato y universidad.

Veamos la siguiente tabla con datos del INEGI donde se observa la relación entre

ingresos y nivel educativo diferenciado por sexo:

Año/Nivel educativo Sexo del jefe de familia

Jefe hombre Jefa mujer

2000 I.M.E.H D.S N I.M.E.H D.S N

Primaria incompleta 7,489 7,617 4,185 8,146 7,593 1,067

Primaria completa 11,180 10,170 2,948 11,960 10,581 626

Secundaria completa 18,780 18,040 4,150 19,177 18,591 765

Superior/universidad 44,667 35,543 930 40,821 29,470 147

completa

Tabla 1. Ingresos medios equivalentes del hogar

Ingresos medios equivalentes del hogar (I.M.E.H), desviación estándar (D.S.) y número de hogares (N) según nivel
educativo alcanzado y sexo del jefe de hogar. Universo: Jefes de hogar menores de 65 años. México, 2002. Pesos de
2002

Además de la relación que vemos entre nivel educativo e ingreso, en México se observa

también una relación de nivel educativo con prestigio social. Esto se hace patente en el

trato, por ejemplo, con personas que cuentan con un grado universitario, a quienes los

demás se dirigen por su título: licenciado, maestro o doctor. O en aquellos casos en los

cuales una familia trata al hijo mayor, que está estudiando el bachillerato y tiene el mayor

88
grado educativo de la familia, con respeto y admiración; y toman en serio sus opiniones

porque se le considera más inteligente, más culto, más apto para convivir en la sociedad.

Muchos consideran la educación como un medio de movilidad social.

Con relación a la lengua misma, hay una creencia generalizada de que la gente más

educada habla “mejor”. Es decir, que su lengua de uso es la lengua estándar o que debería

serlo. Cuando esto no ocurre, el resto de la comunidad (con distintos grados de

educación) actúa en consecuencia mostrando actitudes de falta de respeto. Por lo anterior,

para este estudio seleccionamos la variable nivel educativo con los siguientes

subfactores:

Nivel educativo

Primaria y secundaria

Preparatoria

Universidad y posgrado

Tabla 2. Nivel educativo y subfactores

La primaria y la secundaria se agruparon dado que ambas conforman el nivel básico en

México y es obligatorio en todo el país. La universidad y el posgrado se integraron

porque en la actualidad se nota que muchas personas que estudian la universidad

continúan con sus estudios en el siguiente nivel y en general no se observan grandes

diferencias entre uno y otro nivel.

Esta variable de nivel educativo desempeña un papel relevante para esta investigación

porque la sugerimos como la principal motora no del cambio de hiato a diptongo, sino de

las tendencias hacia la variante [j] o [e̯]. Vuskovich (2006) estudió la resolución de hiatos

89
en la ciudad de México desde una perspectiva sociolingüística considerando la edad y el

género como variables externas, y los grupos vocálicos /a + e/, /e + a/, /o + a/ y /o + e/ en

el nivel postléxico. El autor encontró que la mayoría de estos grupos permanecen

heterosilábicos, es decir, el hiato se mantiene. Sin embargo, cuando la resolución se

efectúa, se recurre principalmente a las siguientes estrategias con la frecuencia

correspondiente al orden de aparición: 1) formación de deslizada de vocal no alta 13 V1, 2)

formación de deslizada de vocal no alta V2, 3) elisión de V1, 4) elisión de V2 y 5)

formación de deslizada alta de V1. Vuskovich ha sido el primero en reportar en un estudio

sociolingüístico la existencia de formación de diptongos con deslizadas medias; sin

embargo, no consideró el factor clase social o nivel educativo en su estudio.

Por experiencia en la comunidad de habla, la hipótesis que postulamos es que los

hablantes con mayor nivel educativo van a favorecer el diptongo con la deslizada media

[e̯] y los sujetos con un nivel de instrucción bajo favorecerán el diptongo con la deslizada

alta [j]. Es decir, la variación que se evidencia en la comunidad de habla con respecto a la

diptongación como un tipo de resolución está condicionada por el nivel educativo de los

miembros de dicha comunidad. De manera resumida mostramos a continuación un

cuadro con las variables independientes:

13
En la presente tesis la llamo deslizada media.

90
Variables internas

Calidad de la vocal siguiente El acento

a) [a] a) V1
b) [e] b) V2
c) [o] c) VSS (vocal de la
sílaba siguiente)

Tipo de sílaba
Grado de sonoridad de las vocales
en contacto a) Abierta
a) Creciente b) Cerrada
b) Constante

Tabla 3. Variables internas

Variables externas

Instrumento
Sexo
a) Entrevista
a) Mujer
b) Prueba de transformación
b) Hombre
c) Prueba de reconstrucción fonética

Edad Nivel educativo

a) 18-24 a) Primaria y secundaria


b) 25-35 b) Preparatoria
c) 36-55 c) Universidad y
d) 56-65 posgrado

Tabla 4. Variables externas

3.4 Definición de contextos lingüísticos de la variable: e + V

Como lo hemos expuesto en páginas anteriores, nos interesa observar la resolución de

hiatos en un contexto bastante limitado: las formas finitas y no finitas de los verbos –ear

91
en español mexicano. Así, tendremos verbos en cualquier tiempo y modo, además de

infinitivos, gerundios y participios. Los contextos también están limitados por:

• La calidad de la V2: [a], [e] [o]

• Sílaba abierta o cerrada

• Acento en la V1, V2 o VSS

• Sonoridad creciente o decreciente

3.5 Hipótesis

A manera de resumen, presentamos las hipótesis de esta investigación:

1. La formación de diptongo es la resolución de hiato más utilizada en los verbos –

ear en español mexicano.

2. En el caso de vocales idénticas en contacto con los verbos –ear, no ocurre que una

se elida; sino que formará diptongo.

3. El acento es la principal condicionante lingüística que inhibe la formación de

diptongos, ya que las vocales que reciben acento son más resistentes a los

cambios.

4. En español mexicano hay una tendencia a evitar secuencias vocálicas con

sonoridad constante; es decir, se prefiere una secuencia vocálica cuyos elementos

se distingan lo más posible en cuanto a sonoridad.

5. La traslación acentual en español mexicano no es favorecida.

6. Las sílabas abiertas favorecen el mantenimiento del hiato.

92
7. Los grupos más jóvenes favorecen la resolución del hiato con estrategias

diferentes a la heterosilabificación.

8. Las personas con nivel educativo alto favorecen la deslizada media [ĕ], mientras

que aquéllas con un nivel bajo favorecen la deslizada alta [j].

9. La entrevista favorece la resolución de hiatos con estrategias diferentes al

mantenimiento del mismo.

3.6 Sujetos

3.6.1 Población

Respecto a la población seleccionada para este estudio, cabe aclarar aquí que ésta se

seleccionó por cuestiones de interés personal, por el acceso más fácil a los miembros de

la comunidad y por mi conocimiento y experiencia con la comunidad de habla, ya que

todo esto facilita la interpretación de las variables sociales, su interacción y el tipo de

variación existente.

Dicha población se ubica en México, un país con el mayor número de hispanohablantes

(100,000,000 aproximadamente) en el mundo. Chetumal, la población de interés para esta

investigación, es la capital del Estado de Quintana Roo en México. Dicho estado está

localizado en el sureste del país, en la península de Yucatán, y tiene frontera con Belice.

Abajo se indica la localización de Chetumal.

93
Figura 18. Ubicación de Chetumal

El Estado de Quintana Roo tiene una tasa de crecimiento poblacional anual de 5.95% ,

esto como resultado de la sostenida inmigración procedente principalmente de la

Península de Yucatán, Veracruz, Distrito Federal y Guerrero, entre otros, que llegaron a

las zonas turísticas del norte del Estado y a Chetumal en el Sur. Se estima una población

indígena maya del 23 % y de éstos las mayoría es bilingüe: español y maya (92.8 %)

(Enciclopedia de los Municipios de México, 1999).

De acuerdo con el censo 2005 proporcionado por el Instituto Nacional de Estadística,


Geografía e Informática de México, la población total de Chetumal es de 136,825
habitantes; 67,039 son hombres y 69,786 son mujeres. Por edades, tenemos la siguiente
distribución:

Grupos por edad Número de


quinquenal habitantes
15-19 años 13,739
20 -24 13,057
25-29 11,598
30 -34 11,410
35-39 10,119
40-44 8,812
45-49 7,128
50-54 5,557
55-59 3,965
60-64 2,871
65-69 1,854
70-74 1,285
75-99 1,836
Tabla 5. Habitantes por grupos etarios

94
Lipski (2004) distingue en general cuatro zonas dialectales en México: México central,

Noroeste de México, Yucatán, y Dialectos Costeros -Veracruz, Tabasco y Acapulco-.

Aunque por su ubicación en la península de Yucatán y por tener una población maya

bilingüe (características que comparte con Yucatán y Campeche, los otros estados que

forman parte de la península), podría sugerirse que en Chetumal predomina el dialecto

yucateco, la constante inmigración de gente procedente de zonas dialectales diferentes

(central y costero principalmente) hace de la ciudad un encuentro de dialectos. Además,

por colindar con el país de Belice, Chetumal es un centro de comercio y de estudios para

los beliceños quienes visitan la ciudad con regular frecuencia o residen en la misma para

realizar estudios.

3.6.2 Muestra

El tipo de muestreo para este estudio es aleatorio estratificado; es decir, considerando las

variables externas de edad, sexo y nivel educativo, que consideramos mantienen una

relación con las variables lingüísticas, conformamos estratos que representan la población

y que cada uno funciona independientemente. En cada estrato aplicamos un muestreo

aleatorio estratificado también para elegir los elementos concretos. La técnica usada para

conseguir a los informantes fue la del “amigo de mi amigo”; es decir, a través de

conocidos se consiguieron contactos que ayudaron a conformar la muestra. Inicialmente

se diseñó la muestra con un total de 48 sujetos, teniendo una distribución uniforme de dos

informantes en los diferentes estratos. Sin embargo, fue difícil encontrar sujetos para cada

estrato por lo que la muestra resultó al final con 38 informantes:

95
Edad Nivel Educativo Mujeres Hombres Total
18-24 Primaria y secundaria 2 1 3
Preparatoria 2 1 3
Universidad y Posgrado 2 2 4

25-35 Primaria y secundaria 2 2 4


Preparatoria 2 2 4
Universidad y Posgrado 2 2 4

36-55 Primaria y secundaria 2 2 4


Preparatoria 2 2 4
Universidad y Posgrado 2 1 3

56-65 Primaria y secundaria 2 2 4


Preparatoria 0 0 0
Universidad y Posgrado 0 1 1

Total 20 18 38
Tabla 6. Distribución de la muestra

Se seleccionó este tipo de muestreo dado que se trata de un estudio sociofonético en el

que las variables sociales desempeñan un papel importante y es esencial contar con

sujetos en cada categoría de los diferentes grupos de variables. Consideramos que se

requería de por lo mínimo dos informantes de cada sexo por cada variable para lograr una

representatividad en la muestra; sin embargo, fue imposible encontrar hablantes mayores

de 55 años con preparatoria y universidad y algunos de los otros grupos.

El uso de corpora ya elaborados o muestras aleatorias simples no parecen adecuados para

cumplir con los objetivos de este trabajo de investigación, pues nos enfrentaríamos con

varias dificultades: no encontrar representatividad de todas las variables de interés en la

población; se podría tener más o menos sujetos (cobertura inadecuada); y falta de

cooperación por parte de algunos sectores de la población. Por otra parte, dado que la

intención es obtener muestras de la lengua vernácula en los informantes a través de la

entrevista sociolingüística, en el caso del muestreo aleatorio simple, entablar una

conversación con un completo extraño (como sería el entrevistador) inhibiría de alguna

96
forma la producción de los sujetos de un estilo de habla más espontánea. Trabajar con un

corpus recogido por otros investigadores carecería de esta representatividad de las

variables sociales de nuestro interés.

3.7 Instrumentos

En consonancia con la metodología variacionista y el enfoque experimental, para esta

investigación utilizamos la entrevista sociolingüística en la tradición de Labov y la

complementamos con una prueba de sombreado y reconstrucción fonética (shadowing-

task en inglés), y otra de transformación, las cuales facilitaron una buena cantidad de

observaciones que integran el corpus de análisis. Enseguida describimos cada uno de los

instrumentos.

3.7.1 La entrevista sociolingüística

Se seleccionó este instrumento considerando que, por ser tradicional de la metodología

variacionista, nos permitiría observar la variación que nos interesa y recoger datos

directamente de los hablantes de la comunidad. La principal preocupación con la

entrevista, como es bien sabido, es la paradoja del observador. Si bien es cierto que la

entrevista como tal supone un acto de habla definido en un contexto formal, en un

formato dado (entrevistador-entrevistado), el tipo de preguntas que se formulan y las

habilidades del entrevistador desempeñan una función importante para motivar una

lengua vernácula por parte del informante.

97
Esta entrevista, siguiendo a Labov (1972b), está estructurada en módulos de preguntas

alrededor de temas específicos, tales como la niñez, el trabajo, el barrio o la ciudad,

peligro de muerte, entre otros; sin embargo, el protocolo se adoptó al contexto mexicano-

chetumaleño14 incluyendo preguntas que hacen referencia a la comunidad de habla de

interés, como la que alude a la presencia de beliceños en Chetumal. Aunque se contaba

con el protocolo, dependiendo del informante y la manera como se desarrolló la

entrevista, se añadieron o cambiaron preguntas, pues el objetivo era motivar el habla

espontánea y natural de los informantes.

Las entrevistas tuvieron una duración de 30 minutos y algunas se llevaron a cabo en la

casa de los mismos informantes, cuando así lo solicitaron; o en un espacio cerrado de la

Universidad de Quintana Roo, pues por ser un lugar público los sujetos se sentían con

confianza y tenían la seguridad de que era un trabajo de investigación serio. La entrevista

fue personal. Solamente el informante y la entrevistadora participaron en la entrevista. Se

utilizó una grabadora digital y micrófono de corbata.

Antes de la entrevista, los informantes tenían que leer el formato de consentimiento de

participación donde se les informaba sobre el estudio y tenían que firmarlo15. No se les

pidió en la entrevista ningún dato personal, excepto su nombre (no necesariamente

apellido), su edad y nivel educativo.

14
Ver protocolo de entrevista en el Apéndice A.

15
Ver Forma de consentimiento en Apéndice E.

98
3.7.2 Prueba de sombreado y reconstrucción fonética

Esta técnica, usada por van der Veer (2006) en su estudio sobre los diptongos en italiano,

en combinación con una prueba de restauración de fonemas, es una nueva herramienta en

el campo de la investigación de la variación lingüística.

Lambert (1988), citado por van der Veer (2006), recomienda la tarea del sombreado para

el entrenamiento de intérpretes simultáneos y define dicha tarea como:

[…] a paced, auditory tracking task which involves the


immediate vocalization of auditorily presented stimuli, i.e.
word-for-word repetition in the same language, parrot-style, of
a message presented through headphones (p.381).

Se le llama sombreado porque uno o algunos segmentos de una palabra son cambiados

por ruido blanco; también recibe el nombre de reconstrucción fonética porque el oyente

debe repetir lo que escucha reconstruyendo los sonidos faltantes; es decir, debe cubrir los

huecos (que generalmente por contexto son fáciles de deducir). Esta técnica del

sombreado se aplicó a 21 oraciones breves (máximo ocho palabras). Los verbos –ear

están distribuidos de la siguiente manera: 7 en presente simple (cuatro con sílaba abierta

y tres con sílaba cerrada); cuatro en pretérito (tres con sílaba abierta y uno con sílaba

cerrada) y tres en futuro (sólo hay con sílaba abierta). Hay cinco enunciados distractores

(fillers) y dos más son de práctica al inicio de la prueba.

La selección de los verbos para estos enunciados se hizo considerando su frecuencia de

uso: 75% son de alta frecuencia y 25% de mediana frecuencia, según el Corpus del

español (Davies, 2002). Esto se hizo considerando que, con una selección arbitraria de

los verbos, los informantes podrían no estar familiarizados con ciertos verbos y, en

consecuencia, podrían alterarlos al intentar repetir el enunciado. Un segundo criterio para

la elección de estos verbos fue el contexto fonético alrededor de la secuencia vocálica. Se

99
escogieron los verbos cuyo grupo vocálico estuviera precedido por una oclusiva /b, p, t,

k/ y en un solo caso por la fricativa [] pues limitar el contexto fonético a estos

segmentos facilitaría el análisis acústico. Se integraron todas las personas gramaticales

que implican las vocales /a,e,o/ en los diferentes contextos de sílaba abierta y cerrada de

las desinencias verbales, así como los diferentes patrones acentuales: acento en la V1, ó

en la V2, o en la VSS 16.

Los enunciados grabados fueron leídos por una mujer joven originaria de Chetumal, la

población de interés. Dado que en la literatura se señala que los hiatos tienen una

duración mayor que los diptongos, con el objeto de controlar la duración y mantenerla

constante, se le pidió a la mujer leer todos los enunciados con hiatos (aunque ella misma

espontáneamente generaba diptongos en algunos casos). Se decidió uniformar la duración

según los hiatos y no los diptongos porque por experiencia observamos que los verbos –

ear en presente simple generalmente no se diptongan, pues la V1, la [é] en todos los casos

es la que recibe el acento prosódico. Si se diptongaban todos, estas formas sonaban

forzadas e improbables. Además, dada las reglas sobre la producción de hiatos, todas

estas secuencias deberían pronunciarse como hiatos. Así para evitar tener algunos hiatos

y algunos diptongos, todos se produjeron como hiatos. La velocidad del habla se controló

de manera que fuera similar en todas las oraciones. Con ayuda de Praat (Boersma y

Weenink, 2008) se tomaron las medidas del hiato de cada verbo y con el programa

Audacity, un editor digital de audio, se hizo el sombreado; es decir, se eliminó el hiato y

se rellenó ese espacio, teniendo las medidas precisas, con ruido blanco. Las oraciones se

16
Ver lista de enunciados en Apéndice B.

100
ordenaron empezando por los de práctica y después mezclando las oraciones en presente,

en pasado y en futuro, e intercalando los enunciados distractores.

Además del input auditivo, se elaboraron unos dibujos17 que representan el contenido de

las oraciones con el fin de apoyar el significado de lo escuchado y facilitar la repetición.

Así, antes de escuchar la oración, los sujetos veían los dibujos y esto les ayudaba a

entender o predecir más fácilmente lo que escuchaban. Se decidió complementar esta

técnica con dibujos después de que en un estudio piloto realizado se observara que los

informantes, confiándose sólo en el input auditivo, pedían escuchar la oración hasta tres

veces. Con el uso de los dibujos, escuchar la grabación una vez era suficiente la mayoría

de las veces.

La duración de la prueba fue de 15 minutos como máximo, y se realizó inmediatamente

después de la entrevista. Los informantes escuchaban los enunciados y debían repetirlos

tales cuales en cuanto la grabación terminaba. Podían escuchar la oración dos veces, si

era necesario. Las instrucciones se daban al inicio y se hacía la práctica con ellos (que

incluía dos enunciados). Para esta prueba de sombreado y reconstrucción fonética se usó

una computadora portátil con micrófono y audífonos Plantronics. En la medida de lo

posible, estas pruebas se realizaron en un lugar cerrado sin ruidos.

17
Ver dibujos en Apéndice D.

101
3.7.3 Prueba de transformación

La prueba de transformación consiste en la lectura de enunciados18 fraccionados en tres

juegos de tarjetas. En el primero incluimos un adverbio de tiempo junto con el sujeto;

esto es con la intención de que los informantes sepan en qué tiempo conjugar los verbos.

El segundo juego de tarjetas contiene los verbos en su forma infinitiva. En total tenemos

21 verbos, de los cuales cinco son distractores y dos son de práctica. Cinco corresponden

a presente, cinco a pasado y cuatro a futuro. Finalmente, en el tercer juego de tarjetas

tenemos un complemento corto, el cual iniciará con oclusiva en los casos en los que la

secuencia vocálica pertenezca a una sílaba abierta. Esto se hizo así para uniformar el

contexto fonético posterior al grupo de vocales y facilitar el análisis fonético. La

selección de los verbos para esta prueba se hizo atendiendo los mismos criterios

utilizados para la prueba de sombreado y reconstrucción fonética.

La duración de esta prueba era de 10 minutos aproximadamente y se realizaba

posteriormente a la prueba de sombreado y reconstrucción fonética. Las tarjetas estaban

enumeradas y se colocaban cara abajo en el orden que debían leerse. Los sujetos de

estudio debían tomar una tarjeta de cada juego, voltearla y leer la oración completa y de

corrido conjugando el verbo en infinitivo en el tiempo que concordara con el adverbio de

tiempo de la primera tarjeta.

En conjunto, la entrevista y estas pruebas fonéticas tomaron una hora aproximadamente.

Dado que la muestra incluyó finalmente sólo 38 sujetos, los datos recogidos por cada

18
Ver enunciados en Apéndice C.

102
instrumento integraron un considerable corpus (de 1151 ocurrencias) que nos ha

permitido verificar o rechazar nuestras hipótesis.

3.8 Procedimientos para el análisis de los datos

Con el fin de cumplir con el Principio de Responsabilidad (Principle of Accountability),

se consideraron todas las formas finitas y no finitas de los verbos –ear. Si en la prueba de

sombreado o en la de transformación resultaron confusiones de verbos, pero se mantenían

verbos -ear, esas ocurrencias se aceptaron; por ejemplo, si en vez de “bateó”, algún

sujeto la confundió con otro verbo como volteó”, ésta se contaba. Sólo se descartaron las

ocurrencias de verbos que no eran –ear. Tampoco se contaron los casos de

hipercorrección: uso de las desinencias de los verbos –ear para los verbos –iar, pues

solamente nos concentramos en este estudio en los verbos –ear y nuestro objetivo no es

analizar la hipercorrección que se da con los verbos -iar, aunque obviamente la presencia

de casos de hipercorrección se consideraron de manera aislada en el análisis cualitativo.

Otro tipo de confusiones que pueden surgir en la recolección de datos es que los sujetos

consideren un verbo –ear como –ar y, por tanto, las desinencias se apeguen a las de –ar.

Estos resultados, sin embargo, serían los mismos si los informantes recurrieran a la

elisión de la V1 en la resolución de hiatos. En estos casos se analizó la frecuencia de uso

del verbo y si resultó ser de alta frecuencia, se consideró elisión. Si era de mediana

frecuencia, se analizó como un caso aparte.

103
3.8.1 Análisis acústico

Atendiendo estudios previos, se consideró la duración de las secuencias y los valores

formánticos como los correlatos acústicos para determinar si las secuencias se

pronunciaban como hiatos o diptongos. Al respecto, recordemos lo que dice Aguilar

(1999):

[…] we say that a hiatus has become a diphthong when at least two of the
following conditions are met: (a) there are not vowel targets but a continuous
formant movement from a frequency area to another; (b) F1 and F2 are situated
at lower frequency areas than the intended hiatuses; (c) duration is reduced.

Con el fin de determinar la estrategia usada por los hablantes, el primer paso a seguir fue

la extracción de las observaciones de los verbos –ear, ya sea en formas o infinitas en los

tres instrumentos empleados. Se obtuvo así un total de 1151 observaciones después de

desechar algunas por su baja calidad de grabación e imposibilidad de analizarlas en los

espectrogramas. Enseguida se calcularon las medidas de duración de cada secuencia

vocálica utilizando espectrogramas de banda ancha (500 Hz). Dado que para las pruebas

de sombreado y transformación se usaron palabras cuya primera consonante en contacto

con la secuencia vocálica fuera una oclusiva /p t k b d/, se midió la duración a partir del

primer impulso glotal de la vocal en cuestión después de la barra de explosión que sigue

al silencio propio de estas consonantes.

Las consonantes posteriores a la secuencia fueron /s l /. Siguiendo a

Martínez Celdrán (1998) y las propias observaciones, en el caso de la fricativa /s/ que

apareció después de la vocal, la transición es evidente por el ruido turbulento y los

inarmónicos, por lo que la medición se calculó hasta el último impulso glotal claro de la

104
vocal. [se caracterizan por una intensidad mucho menor que las vocales

vecinas, lo que se refleja en el negror de las zonas formánticas. Así, observando la

pendiente de intensidad y las zonas formánticas, se determinó el fin de la secuencia en el

punto de caída de la pendiente de intensidad.

Con las nasales/ m n/ y la lateral /l/, consideramos la diferencia en energía e intensidad de

los formantes entre éstas y la vocal que le antecede. En realidad, la diferencia es muy

marcada y a partir del cambio de intensidad se marcaba el final de la secuencia. El

ejemplo debajo de la secuencia /ea/ seguida de una nasal alveolar ilustra este punto:

Figura 19 Secuencia /ea/ seguida de nasal alveolar

En cuanto a la vibrante simple, se consideró que muestra interrupción de energía (muy

similar a una oclusiva) con una barra de explosión generalmente. El final de la secuencia

vocálica se marcó en el último pulso glotal antes de la interrupción. La figura siguiente

nos muestra este caso.

105
Figure 20 ¨batearán

Además de la duración, se tomaron como parámetros los valores de los formantes F1 y

F2, aunque en la literatura se enfatiza el valor de F2 como el factor determinante para la

distinción entre hiatos y diptongos (Martínez Celdrán, 1998). Sin embargo, los valores

formánticos de F1 se consideraron para establecer cambios en la calidad de la vocal, pues

las variantes muestran deslizadas medias y altas. Garrido (2007) encontró que “the lower

the value of the F1 in the first element of a mid/low vowel sequence, the higher the

degree of diphthongization”. Por su parte, Aguilar (2006) señala que “las diferencias

entre el resultado fonético de la pérdida de silabicidad de una vocal alta y el de una vocal

no alta residen obviamente en la localización de las frecuencias, pero no en el tipo de

movimiento.

Adicionalmente, otro criterio a observar en los espectrogramas, según Aguilar (2006), es

que una secuencia vocálica se convierte en diptongo cuando “una de las dos zonas

estables desaparece a la vez que se aprecia una transición continua del segundo formante

desde una zona de frecuencias formánticas a otra”. Por ello, se tomó también como

106
parámetros la pendiente de la trayectoria formántica, la observación y análisis de los

oscilogramas y espectrogramas, y la valoración auditiva impresionista de dos

codificadores. Con todos estos datos, se clasificaron las observaciones según el tipo de

resolución usada. Veamos el procedimiento paso a paso:

Primero se midió la duración de cada secuencia, después se registraron y se extrajeron los

valores de los formantes F1 y F2 cada treinta milisegundos. Se observó que muchas

duraciones de las secuencias de este corpus eran mayores que las reportadas en la

literatura tanto para hiatos como para diptongos. Por tanto, estos valores obtenidos cada

treinta ms. fueron suficientes para el análisis posterior de la pendiente y definición de la

estrategia utilizada. Cabe aclarar que en el caso de secuencias breves menores de 90 ms,

se cambió la extracción de los valores a cada 20 ms. La intención con esto era tener un

panorama general de la forma de la pendiente y los valores de los formantes en diferentes

momentos para determinar el vocoide implicado.

Siguiendo el mismo procedimiento realizado en previos estudios para el análisis de

diptongos (Borzone de Manrique, 1979; Maddieson and Emmorey, 1985), se procedió a

establecer fases en la trayectoria formántica de F1 y F2 para identificar las vocales

implicadas y observar los cambios entre las distintas fases de la secuencia. Estas fases se

corresponden con el segmento inicial, una transición y el segmento final. Sin embargo, a

diferencia de estudios previos que dividen la secuencia al 25, 50 y 75%, en este estudio

calculamos un promedio móvil representativo de cada área. Es decir, se extrajeron los

valores de F1 y F2 cada 30ms.y dependiendo del número de intervalos, se agruparon en

tres fases: inicial, media y final y se calcularon sus promedios. Esto nos permitió observar

la duración en cada fase, el cambio de velocidad y de zonas de frecuencias a lo largo de

107
toda la secuencia. Consideramos importante tomar en cuenta el inicio de la secuencia y su

duración siguiendo a Borzone de Manrique (1976) en su estudio de diptongos del

español, quien encontró que una distinción entre hiatos y diptongos es que los primeros

muestran una duración mayor de la misma zona de frecuencias en el área inicial, que se

correspondería con la primera vocal objetivo. Cabe aclarar también que aunque se

segmentó la secuencia en tres áreas, cuando se hizo el análisis integrando todos los

parámetros, se mantuvieron visibles los promedios móviles de los valores de los

formantes, pues ofrecían una descripción más clara del movimiento de la trayectoria de la

pendiente y de las frecuencias de los vocoides presentes. Es decir, para casos confusos, se

recurría a todos los promedios móviles y no sólo a las tres fases.

En los casos de elisión, la misma Aguilar indica que “la elisión en el contacto de vocales

idénticas o diferentes se identifica por la presencia de un único segmento, sin que en la

secuencia interconsonántica varíe ni la frecuencia de los formantes ni la forma de onda”.

Para evitar confusiones con producción de vocales largas en las secuencias de vocales

idénticas (que en este estudio es sólo [e.e], se registraron los valores medios de ejemplos

de la vocal [e] pronunciada por los informantes en los mismos contextos fonéticos, que

sirvieron de parámetro para determinar si trataba de una vocal larga o de elisión.

La valoración auditiva impresionista de dos codificadores se basó únicamente en

escuchar la palabra completa y registrar la estrategia percibida; es decir, cada codificador

de manera independiente escuchó las palabras que incluían las secuencias de interés y

anotó la estrategia que percibió. Aquí la elección era entre hiato, diptongo con media,

diptongo con alta y elisión. Sin embargo, algunos casos de la estrategia de fusión y de

hiato con /i/ se identificaron en este análisis. Después se compararon las apreciaciones de

108
cada codificador. Si no coincidían, la determinación de la estrategia usada se basaba en

los otros parámetros.

La pendiente de la trayectoria formántica se calculó a partir de las tasas de crecimiento de

los intervalos de frecuencias y su duración. De esta manera, fue posible ver la presencia

de cambios continuos (diptongo) o de un cambio brusco (hiatos) en la pendiente.

Para establecer la estrategia de resolución usada, se analizaron las palabras extraídas de

los tres instrumentos agrupándolas por informante. Así, atendiendo la duración total de la

secuencia, los promedios de los valores de F1 y F2 en las tres fases y su correspondiente

duración, las tasas de crecimiento por fase y en conjunto de la pendiente, y la estrategia

percibida por los codificadores se establecía la estrategia de resolución. Los valores de F1

y F2 de los vocoides objetivo se compararon con los valores que en la literatura aparecen

como valores generales de las vocales del español (Martinez Celdrán, 2007) y con los

valores de /e/ extraídos de la producción de cada informante. En algunos casos en los que

los parámetros daban resultados ambiguos, se revisó cada uno de los valores de F1 y F2 a

lo largo de toda la secuencia y no sólo los promedios; también esto fue útil para

determinar cambios continuos o un cambio brusco en la pendiente.

Estas mediciones y datos acústicos fueron imprescindibles para este estudio, ya que por

ser un estudio también variacionista se requieren variables discretas, y para llegar a éstas

fue necesario establecer primero las estrategias de resolución, las cuales son las variantes

que se utilizan en el análisis cuantitativo.

109
3.8.2 Análisis estadístico

Ya que esta investigación es de corte eminentemente cuantitativa, el análisis estadístico

es una parte esencial de la misma. Dado que para el análisis de nuestra variable partimos

de varios factores lingüísticos y sociales, necesitamos evaluar los efectos de cada uno de

ellos en nuestras variantes a través de un análisis multivariado. La cuantificación y

análisis estadístico de los datos se hizo con Goldvarb X (Sankoff et al., 2005), un

programa basado en análisis de reglas variables. GoldVarb X utiliza un procedimiento de

regresión múltiple que, de acuerdo con Sankoff (1988) y refieriéndose a VARBRUL, nos

permite determinar qué factores tienen un efecto estadísticamente significativo en la

selección de una variante; si el efecto favorece o desfavorece; y el peso del efecto cuando

se consideran todos los factores de manera simultánea.

Los grupos factoriales considerados para el análisis fueron: instrumento de recolección,

sexo, edad, nivel educativo, calidad de la vocal siguiente, grado de sonoridad, acento,

tipo de sílaba y tipo de forma finita o infinita. Se conformó un código de letras para

identificar cada uno de estos factores y sus subfactores19. Cada ocurrencia se etiquetó con

su código correspondiente integrando toda esta información. Ya que la función de

regresión múltiple de Goldvarb requiere de un valor de aplicación binario; es decir, sólo

dos factores para la variable dependiente, usaremos el valor del mantenimiento de hiato

[e] V como el valor de aplicación y agruparemos las otras variantes en un grupo que será

resolución. Así, primero analizaremos el mantenimiento y la resolución; posteriormente

cambiaremos los valores de aplicación usando diferente valor de aplicación según las

diferentes estrategias comparando esa estrategia contra el grupo del resto.

19
Ver en Capítulo 5 tablas de variables internas y externas.

110
Se graficarán los resultados arrojados por el programa y se harán también tabulaciones

cruzadas para analizar las interacciones entre los factores. De esta manera, se

identificarán los porcentajes, las ponderaciones y el grado de significancia de cada factor

y subfactor en relación con las diferentes variables dependientes.

Análisis de casos especiales

Las estrategias de resolución que se identificaron en el estudio acústico, pero que no

estaban planteadas inicialmente también se analizaron con GoldVarb. Las ocurrencias de

autocorrección se consideran en el análisis cualitativo.

111
Capítulo 4: Análisis de los resultados

4.1 Análisis de los resultados acústicos

Analizando la duración como uno de los principales correlatos acústicos para distinguir

entre hiatos y diptongos, tomamos las medidas en los tres instrumentos de recolección y

no se encontró mucha diferencia entre las duraciones de secuencias en la entrevista y la

prueba de sombreado. En realidad, los promedios de la entrevista y de la prueba de

sombreado son similares. En la prueba de transformación se notó una ligera duración

mayor. En la tabla de abajo se presentan los promedios de los diptongos e hiatos según el

instrumento e incluyendo a todos los informantes.

Duración en entrevista y prueba de sombreado (en segundos)


hiato con /e/ 0.17
hiato con /i/ 0.16
diptongo con // 0.11
diptongo con /j/ 0.12
Tabla 7. Duración de hiatos y diptongos en entrevista y prueba de sombreado

Duración en prueba de transformación (en segundos)

hiato con /e/ 0.19

hiato con /i/ 0.20

diptongo con // 0.13

diptongo con /j/ 0.16


Tabla 8. Duración de hiatos y diptongos en prueba de transformación

112
Como se observa, la duración de las secuencias con vocoides altos en general es mayor

que la de los vocoides medios y esto es por la duración intrínseca de la vocal misma, al

parecer. Cabe aclarar que aunque se presentan estas medidas, éstas son sólo promedios

porque en realidad hay muchos traslapes entre hiatos y diptongos. Incluso, en un mismo

hablante hay muchas intersecciones, pues todo depende de la velocidad de habla y es

muy difícil controlar esta variable. Por ejemplo, hubo casos de diptongo en la prueba de

transformación cuya duración era mucho mayor que un hiato. Los motivos pueden ser

varios: una preocupación por articular bien los segmentos porque los hablantes se sentían

evaluados o también puede ser un efecto léxico; es decir, si el verbo a conjugar era más

familiar, su realización era más rápida, pero si el verbo no era tan frecuente o familiar,

pues entonces la pronunciación era más lenta. Esto sugiere que la duración, aunque en

general es un indicador de la distinción entre hiato y diptongo, no se puede considerar el

de mayor peso o el único para determinar la naturaleza silábica de las secuencias

vocálicas.

Otro parámetro considerado fue la pendiente de la trayectoria formántica F2. En la

literatura se señala que la pendiente de los hiatos es mayor que la de los diptongos, pero

esto a veces resulta confuso porque no se entiende si es la pendiente completa o si es sólo

a partir del punto de transición. La idea es que la pendiente es mayor a partir del cambio

de una vocal a otra. No obstante, el punto de transición en los hiatos es más visible y fácil

de detectar porque en cierto momento habrá una caída abrupta que indica el cambio de

una vocal a otra. Con los diptongos tenemos transiciones durante casi toda la pendiente y

hay caídas abruptas también, pero la diferencia es que pueden ser varias.

113
Para mostrar esto veamos los resultados arrojados para la secuencia /ea/ con un ejemplo

para ver la diferencia entre diptongo y hiato.

FORMANTE F2
intervalos 1 2 3 4 5 6 7 8 9 10 11 12

hiato 2,389 2,608 2,639 2,708 2,697 2,613 2,475 2,270 2,105 1,969 1,950 2,010

diptongo 2,453 2,448 2,305 2,083 1,940 1,905 1,810


Tabla 9. Valores de F2 en hiato y diptongo

Graficando estos valores, tenemos:

3,000.0
2,500.0
2,000.0
1,500.0 HEA
1,000.0
DEA
500.0
-
1 2 3 4 5 6 7 8 9 10 11 12

Figura 21. Pendiente completa en hiato y diptongo

Como se observa, la duración del diptongo es menor (menos intervalos) y su trayectoria

completa es más pronunciada; el hiato tiene una duración mayor y su la forma de su

trayectoria completa muestra menos inclinación en conjunto. Sin embargo, si medimos la

pendiente a partir de la transición de la zona de frecuencia más o menos estable a la

siguiente zona estable u objetivo de la segunda vocal, esta pendiente es bastante

inclinada, pues muestra el cambio brusco de una a otra vocal. Es decir, la pendiente en

conjunto desde inicio a fin es mayor en los diptongos que en los hiatos, pues estos

114
últimos muestran fases constantes en sus zonas de frecuencias que hacen que la pendiente

no se incline sino hasta que hay un cambio brusco. Y es que es lógico que con menos

tiempo, los cambios en las zonas de frecuencias sean continuos y rápidos en los

diptongos, mientras que en los hiatos los cambios se dan más lentos y generalmente se

observa un solo cambio drástico.

Entonces la pendiente conformada por las observaciones del formante F2 puede ser

tomada como un indicador de la presencia de un hiato o un diptongo. En este trabajo

utilizamos el promedio de las tasas de crecimiento de los registros F2 para cada secuencia

y también calculamos la velocidad de la pendiente de la máxima caída atendiendo los

valores de F2 y los intervalos de duración. Los resultados muestran mucha fluctuación en

las pendientes, pero en promedio tanto la tasa de crecimiento de la pendiente completa

como la velocidad de la pendiente en su punto máximo de caída de los hiatos es mayor

que la de los diptongos. Veamos el ejemplo anterior /ea/, pero ahora con tasas de

crecimiento:

FORMANTE F2 TASAS DE CRECIMIENTO


intervalos 1 2 3 4 5 6 7 8 9 10 11 12
Hiato - 9.2% 1.2% 2.6% -0.4% -3.1% -5.3% -8.3% -7.3% -6.4% -1.0% 3.1%
- - -
Diptongo - 0.2% 5.8% 9.6% -6.9% -1.8% -5.0%
Tabla 10. Tasa de crecimiento de la trayectoria de F2

Se observa claramente cómo la pendiente del diptongo es mucho más pronunciada (tasa

de crecimiento promedio -4.19%) que la del hiato (tasa de -1.31). La pendiente del hiato

es más suave porque su recorrido es indirecto: primero prepara la V1, llega a su vocal

115
objetivo (con lo cual el primer intervalo tiene pendiente relativamente horizontal); a

continuación, se traslada rápidamente a la siguiente vocal (la pendiente en este intervalo

es mayor); una vez en la segunda vocal la marca hasta alcanzar un clímax, con lo que la

pendiente vuelve a ser casi horizontal. En el caso del diptongo el traslado de un área de

frecuencia a otra opera de manera continua, por ello la pendiente es más constante y

directa (no presenta intervalos casi horizontales) con lo que se incrementa la pendiente

(presenta números negativos mayores).

Esta prueba de pendiente es eficiente para diferenciar hiatos de diptongos si se trata de

una misma secuencia y bajo el mismo contexto fonético, y por supuesto si es el mismo

hablante en el mismo contexto. Sin embargo, controlar estas variables es muy difícil y de

ahí que resulten traslapes o la prueba no revele claramente estas diferencias. Nuevamente,

el uso de la pendiente (completa o de la transición) puede ayudar en la definición de

hiatos y diptongos, pero tenemos que recurrir a otros correlatos también. Veamos abajo

algunos espectrogramas que distinguen entre hiato y diptongo con deslizada media y alta:

116
Figura 22. Hiato en“pateo”

Figura 23. Diptongo con deslizada media en “pateó”

117
Figura 24. Diptongo con deslizada alta en “pateó”

En los análisis acústicos se observa que en general, los diptongos empiezan en la primera

fase con valores de F1 y F2 altos de su correspondiente vocal subyacente, mientras que

los hiatos inician con valores de F1 y F2 bajos y alcanzan la vocal objetivo al final de la

primera fase o inicios de la segunda. Es decir, si una /e/ plena, por ejemplo, tiene valores

de F2 de 1676 como mínimo y 2212 ó más como máximo, en los diptongos en la primera

fase de inicio aparecen valores más cercanos al máximo. Al contrario, en los hiatos, se

observan valores más cercanos al mínimo en esta etapa inicial. Esto coincide con el

estudio de Borzone de Manrique (1979) y es otro parámetro que ayudó a definir la

estrategia usada. Por otra parte, con los valores de F1 y F2 se pudieron distinguir las

deslizadas medias de las altas. Con deslizadas altas los valores de F1 son más bajos en

general. También los valores de F2 apoyan con esta clasificación. Aquí cabe aclarar que

en el caso de vocales medias que seguían a la oclusiva velar /k/, sus valores eran muy

altos como efecto articulatorio de su contigüidad con la velar. No obstante, se mantenía

una /e/ que era auditivamente perceptible por los codificadores.

118
Otro resultado que vale la pena notar es que en los casos de elisión de la secuencia /eé/,

en general se percibe una vocal larga, ya que sus duraciones fluctuaron entre .08 y .14.

Esto significa que aunque hablamos de elisión en esta secuencia en particular, en realidad

hay una vocal larga. Esto no ocurrió con otros casos de elisión donde la secuencia se

componía de vocales distintas, pues la duración de esta secuencia reducida era de .05 en

promedio. Para llegar a esto partimos de la comparación de la duración de la /e/, como

resultado de una secuencia subyacente, con la duración de una /e/ simple subyacente.

4. 2 Análisis de los resultados estadísticos de GoldVarb

Habiendo definido las estrategias de resolución utilizadas por los informantes, se

procedió a la codificación de las observaciones, las cuales al final resultaron 1151. De

éstas, sólo 105 se recogieron de las entrevistas; 504 provienen de la prueba de sombreado

y 542, de la prueba de transformación. 18 observaciones fueron desechadas por

problemas de grabación que dificultaron su análisis acústico y clasificación

correspondiente.

Aunque inicialmente se plantearon cuatro variantes de la variable dependiente, durante el

análisis acústico se identificaron otras dos estrategias: la formación de hiato con la vocal

/i/ y fusión vocálica teniendo como resultado una tercera vocal. De esta manera, la

variable se analizó en Goldvarb atendiendo seis valores de aplicación diferentes que se

corresponden con cada una de las estrategias identificadas, pues el programa estadístico

es binomial y ofrece regresiones comparando una variante contra el resto.

119
Cabe aclarar también que mientras se realizaba el análisis acústico, se observó que un

mismo hablante mostraba variación en verbos que tenían el mismo contexto fonético pero

se diferenciaban en el tiempo, modo formas finitas e infinitas. Por ejemplo, “pateé” en

pasado y “pateé” en imperativo negativo se resolvían con diferente estrategia por algunos

hablantes. Por tanto, se agregó el factor tipo de forma finita o infinita con ocho

subfactores, que fueron los registrados. Presentamos a continuación la tabla de las

variables con sus respectivos factores y subfactores que se utilizaron en el análisis de

GoldVarb:

Variables internas

Calidad de la vocal siguiente El acento

d) [a] d) V1
e) [e] e) V2
f) [o] f) VSS
Formas finitas e infinitas
(vocal de
a) Presente simple la sílaba
b) Pasado simple siguiente)

Grado de sonoridad de las vocales c) Futuro simple


Tipo de sílaba
en contacto d) Imperfecto
c) Creciente e) Infinitivo c) Abierta
d) Constante f) Gerundio d) Cerrada
g) Participio
h) Imperativo/subjuntivo

120
Variables externas

Instrumento
Sexo
d) Entrevista
c) Mujer
e) Prueba de transformación
d) Hombre
f) Prueba de reconstrucción fonética

Edad Nivel educativo

e) 18-24 d) Primaria y secundaria


f) 25-35 e) Preparatoria
g) 36-55 f) Universidad y
h) 56-65 posgrado

La variable lingüística dependiente con los cambios realizados se muestra abajo:

Variable lingüística dependiente /e V20/

Variantes eV  V jV V iV fusión

Figura 25. Variable lingüística y sus variantes

Considerando de esta manera estos cambios en el análisis, de manera general se observa

que con los verbos -ear la muestra estudiada emplea las seis variantes registradas como

20
V representa aquí cualquier vocal

121
estrategias de resolución de hiatos en diferente proporción. La gráfica abajo ilustra estas

diferencias:

Distribución de las variantes


45
40
35
30
25
20 Porcentajes
15 absolutos
10
5
0
hiato con e diptongo con diptongo con
media alta

Figure 26. Distribución de las variantes principales de resolución

Como puede notarse, la estrategia con más observaciones en la muestra estudiada fue la

de formación de diptongo con deslizada media (39%), seguida por la de mantenimiento


21
del hiato con /e/ (28%) y después nuevamente por la estrategia de formación de

diptongo, pero esta vez con deslizada alta (21%). Si comparamos entonces la estrategia

de mantenimiento versus diptongación (independientemente de la deslizada participante),

tenemos que ésta es la estrategia más usada para resolver el contacto de vocales en los

verbos –ear. El resto de estrategias muestra porcentajes relativamente bajos, aunque de

21
Distinguiremos entre mantenimiento del hiato para referirnos al hiato estándar con /e/ versus hiato con /i/ cuando se
efectúa el mantenimiento con esta vocal.

122
este grupo elisión es la estrategia que sigue por número de casos registrados (8%). El

mantenimiento del hiato con /i/ parece marginal (2%) igual que la fusión (1%). Se

discuten abajo brevemente, pues también son ejemplo de variación.

Enseguida se presentan los resultados de Goldvarb para las variantes (o estrategia) que

resultaron relevantes estadísticamente. Empezaremos con la variante estándar

(mantenimiento del hiato) y proseguiremos con el resto en orden descendiente según su

porcentaje de uso en la muestra. Al final, integramos todos los datos y presentamos una

jerarquización de los factores y subfactores que constriñen la selección de una u otra

estrategia.

4.2.1 Variante mantenimiento del hiato

Empezamos así con los resultados de GoldVarb que se muestran en la tabla siguiente:

123
Total N: 316/1151 Input 0.209 Log likelihood = -329.646

Probabilidad % hiatos con /e/ Total N % Datos

Acento
V1 .97 90 270 23
V2 .27 9 617 54
V3 .19 8 264 23
Rango: 78
Instrumento
Pruebas .52 29 1046 91
Entrevista .30 17 105 9
Rango: 22
Edad

56-65 . 58 31 144 12
18-24 .57 30 332 29
36-55 .51 29 334 29
25-35 .37 23 341 30
Rango: 21
Grado de sonoridad
Creciente .58 30 817 71
Constante .38 22 334 29
Rango: 20

Tabla 11. Factores que contribuyen a la selección de la variante /e/ (hiato).

Como se aprecia en la tabla, dos factores internos (acento y grado de sonoridad) y dos

factores externos (instrumento y edad) son los que parecen condicionar el uso de la

estrategia de mantenimiento del hiato. De éstos, el acento es, sin lugar a dudas, el que

mayor peso tiene en el mantenimiento de la secuencia como heterosilábica; pero más

precisamente es el acento en la V1 el que favorece abrumadoramente esta estrategia. Es

decir, si el acento recae en la vocal /e/ (que es la V1 en todos los verbos –ear), la gran

probabilidad es que se realice un hiato. El grado de sonoridad también desempeña un

papel importante para esta estrategia, pues la sonoridad creciente parece favorecer su uso.

124
En este caso, la secuencia con grado de sonoridad creciente es /ea/ solamente. Veamos la

relación de ambas variables en la tabla siguiente:

Relación variable acento y grado de sonoridad


Total de observaciones : 1151 Valor de aplicación: /e/
N % N % N %
V1 V2 V3 Datos %
Creciente 184/204 90 38/344 11 20/264 8 817 71

Constante 59/66 89 15/268 6 0 0 334 29

Tabla 12. Variables acento y grado de sonoridad con la variante hiato

Tenemos así que las secuencias /éa/, /eá/ y /ea/ presentan porcentajes ligeramente

mayores que las secuencias que mantienen un grado de sonoridad constante. Sin

embargo, cuando la /e/ es tónica, la diferencia es casi nula; ésta se evidencia cuando la V 2

es la tónica, y dado que no se da el caso de formas verbales con secuencias de sonoridad

constante en las que ambas sean átonas, pues no se registraron casos de sonoridad

constante con acento en la V3.

Si bien es cierto que el acento en la V1 muestra una tendencia a favor de los hiatos, el

hecho de que haya un 10% que conlleve a otra estrategia implica traslación o dislocación

acentual. En otras palabras, si la secuencia subyacente recibe el acento en la V1 , pero se

no se realizan hiatos , entonces se entiende que hay informantes que trasladan el acento a

la otra vocal y usan otra estrategia. Este fenómeno se confirmó con el análisis acústico e

impresionista al categorizar las estrategias empleadas.

En cuanto a los factores externos, las pruebas juntas resultaron favorecer el

mantenimiento de los hiatos en contraste con la entrevista. Dado que las pruebas son

125
formas de motivar la lengua y la entrevista tiene como objetivo generar habla espontánea,

de decidió fusionar las primeras.

La edad resultó un factor social clave para la retención de hiatos, siendo tres grupos: los

dos mayores y el de los más jóvenes los que favorecen este tipo de resolución. La

siguiente gráfica muestra la relación edad e instrumento donde se observa la distribución

también:

Relacion edad e instrumento


35
30
25
20
Entrevista
15
10 Pruebas
5
0
18-24 25-35 36-55 56-65

Figura 27. Variables edad e instrumento con /e/ por porcentaje

No se observa una distribución uniforme por grupo etario; es decir, no se muestra un

incremento o decremento constante por edades en la producción de hiatos. Aunque el

grupo de los mayores produce más hiatos, la diferencia no es marcada con respecto a los

otros grupos y, de hecho, el grupo más joven produce más que el siguiente grupo etario.

Por otra parte, la diferencia de número de hiatos entre las pruebas y la entrevista no es

muy grande en la mayoría de los grupos, excepto por el grupo de 25-35 años que realiza

126
un porcentaje mucho mayor de hiatos en las pruebas que en la entrevista. Este grupo es el

que no favorece en general los hiatos.

4.2.2. Variante formación de diptongo con deslizada media

.
Total N: 443/1151 Input 0.322 Log likelihood = --595.356

Probabilidad % diptongos /e/ Total N % Datos

Acento
V2 y V3 .64 48 881 76
V1 .12 8 270 24
Rango: 52
Grado de sonoridad
Creciente .60 46 817 71
Constante .25 21 334 29
Rango: 35
Edad
18-24 .57 43 332 29
25-35 .54 42 341 30
36-55 .46 37 334 29
56-65 . 31 24 144 12
Rango: 26
Instrumento
Entrevista .65 58 105 9
Transformación .52 42 542 47
Sombreado .43 31 504 44
Rango: 22
Nivel educativo
Universidad .62 48 392 34
Preparatoria .47 40 332 29
Primaria y secundaria .40 29 427 37
Rango: 22
Sexo
Hombre .59 46 547 48
Mujer .41 32 604 52
Rango: 18
Tabla 13. Factores que contribuyen a la selección de la variante /e/ (diptongo con deslizada con media)

Como se advierte en la tabla, la formación de diptongo con deslizada media es la

estrategia más utilizada para resolver hiatos en los verbos –ear. Es evidente también el

número considerable de factores que condicionan esta variante: dos variables internas y

127
cuatro externas. De las primeras, el acento, al igual que con la estrategia de

mantenimiento del hiato, se presenta otra vez como factor preponderantemente

determinante en la selección de esta estrategia. Mientras que el mantenimiento del hiato

se constriñe por el acento en la V1 (en la vocal /e/), la formación de diptongo con

deslizada se ve favorecida por la ubicación del acento en la segunda vocal de la secuencia

o en otra vocal de la siguiente sílaba. De manera separada, el porcentaje de diptongos con

deslizada media se incrementa aún más si el acento se ubica en una tercera vocal: V2,

47% y V3, 66%.

Lo anterior implica que la posición o proximidad del acento desempeña un papel

importante, pues a mayor distancia de la secuencia, mayor tendencia a producir diptongos

con deslizada media. Cuando el acento recae en la V1, se inhibe casi totalmente esta

estrategia. Este “casi” nos lleva una vez más al fenómeno de traslación acentual, pues si

la /e/ en el español estándar es tónica, pero se registraron observaciones en las que las

secuencias fueron diptongadas, significa que hay casos de cambio acentual en la muestra

estudiada. Nótese, sin embargo, que los números registrados sobre este fenómeno son

bajos en general.

Otro factor lingüístico relevante es el grado de sonoridad de la secuencia vocálica: si éste

es creciente, los resultados muestran que se favorece la diptongación con deslizada

media. Esto, concretamente, ocurre con la secuencia /ea/ porque el mismo programa de

GoldVarb en la primera corrida arrojó como knockout el subfactor /e/ del factor # 4 que

es “Vocal siguiente”. Es decir, no se da el caso de tener deslizadas medias junto a la

vocal media /e/. Si analizamos ahora la relación entre ambas variables acento y grado de

sonoridad-, tenemos los siguientes resultados:

128
Relación acento y grado de sonoridad
Total de observaciones : 1151 Valor de aplicación: /e/
N % N %
V1 V2 y V3 Datos %

Creciente 16/204 8 358/613 58 817 71

Constante 6/66 9 63/268 24 334 29


Tabla 14. Relación acento y grado sonoridad en diptongos con deslizada media

Tal como muestra la tabla, las secuencias subyacentes /eá/ y /ea/ (en esta última ambas

vocales son átonas) favorecen la formación de diptongos con deslizada media, mientras

que la secuencia de sonoridad constante /eó/ muestra un porcentaje bajo no significativo

(la siguiente vocal /e/ la descartó el mismo programa estadístico por no ocurrir en esta

variante). Las secuencias /éa/ y /éo/ subyacentes que se registraron aquí como formas

diptongadas implican un cambio acentual, ya arriba mencionado. Nótese además que esa

dislocación del acento es independiente del grado de sonoridad subyacente la secuencia,

pues los porcentajes de cada grado son similares.

Las variables externas que parecen constreñir esta estrategia de resolución son la edad, el

instrumento utilizado para la recolección de datos, el nivel educativo y el sexo. Con

respecto a la primero, son los dos grupos más jóvenes los que registran un

favorecimiento. En cuanto al segundo, la entrevista registra una probabilidad mayor de

ocurrencia de diptongación con deslizada media seguida de la prueba de transformación.

En el grupo nivel educativo, son las personas con nivel de estudios universitarios o de

posgrado las que favorecen esta estrategia; y en el grupo de sexo, son los hombres los que

muestran una mayor tendencia. Abajo recogemos en gráficas la relación entre estas

variables externas.

129
Edad e instrumento
100

80

60 Entrevista
40 Transformacion

20 Sombreado

0
18-24 25-35 36-55 56-65

Figure 28. Relación edad e instrumento en diptongo con deslizada media

En esta primera gráfica observamos que hay una clara diferencia entre el instrumento

empleado: en la entrevista se generaron más diptongos con deslizada media, seguida de la

prueba de transformación y finalmente de la de sombreado. Es interesante también que

esta distribución se mantiene en todos los grupos etarios, pero lo que cambia es el

porcentaje de ocurrencias en las pruebas: a mayor edad, menor número de diptongos con

media. Con la entrevista, no se da esta consistencia, pues los grupos medios son los que

producen más diptongos.

Considerando ahora la edad y el nivel educativo, la siguiente gráfica ilustra su relación:

130
Edad y nivel educativo
60
50
40
Primaria y sec.
30
Preparatoria
20
Universidad
10
0
18-24 25-35 36-55 56-65

Figura 29. Relación edad y nivel educativo con /e/ en porcentajes

Vemos una relación clara: a mayor nivel educativo, mayor tendencia a utilizar la

estrategia de diptongación con deslizada media, aunque es claro que el nivel universitario

y posgrado es el que despunta en la gráfica en todos los grupos etarios. También es

evidente, en los grupos de primaria a preparatoria, la relación inversa entre edad y

producción de diptongos con deslizada media; es decir, a mayor edad, menor número de

ocurrencias de esta estrategia, y mientras más jóvenes, más tendencia a favorecer esta

variante. El grupo de universidad y posgrado, sin embargo, no muestra esta consistencia,

pues son los grupos etarios medios (de 25-35 y de 36 a 55) los que encabezan los

porcentajes más altos de diptongos con deslizada media.

Analizando la relación entre edad y sexo, abajo se presentan los porcentajes

correspondientes:

131
Edad y sexo
70
60
50
40
M
30
H
20
10
0
18-24 25-35 36-55 56-65

Figura 30. Relación sexo y nivel educativo con /e/ en porcentajes

Salvo por el primer grupo etario en el que no hay diferencias de sexo en la producción de

diptongos con deslizada media, en el resto de los grupos son los hombres los que tienden

a realizar más esta variante de resolución de hiatos que las mujeres. Sin embargo, dentro

de estos grupos, la diferencia más marcada es en los grupos de 25-35 y de 55-65 en los

que las mujeres registraron 29% y 25%, respectivamente, menos diptongos con media en

comparación con los hombres.

Relación nivel educativo e instrumento


Total de observaciones : 1151 Valor de aplicación: /e/
N % N % N %
Entrevista Transformación Sombreado Datos %

Universidad 19/25 75 101/191 53 68/176 39 392 34

Preparatoria 20/28 71 62/158 39 49/146 34 332 29

Prim. y sec. 22/52 42 64/193 33 38/182 21 427 37


Tabla 15. Variables instrumento y nivel educativo con deslizada media

132
Como se observa, todos los niveles educativos muestran porcentajes mayores en la

producción de diptongos con deslizada en la entrevista, seguida de la prueba de

transformación y finalmente de la prueba de sombreado; es decir, se nota una distribución

uniforme de estos instrumentos en cada grupo educativo. Asimismo, se observa una

relación directa entre el instrumento y el nivel educativo: a mayor nivel educativo, mayor

uso de la estrategia de diptongación con deslizada media en todos los tipos de tipos

instrumentos; a menor nivel educativo, menor número de observaciones en todos los

instrumentos.

Prosigamos ahora con la relación entre las variables sexo y nivel educativo:

Relación sexo y nivel


educativo
80
60
40 M
20 H
0
Primaria y sec. Preparatoria Universidad

Figura 31. Relación sexo y nivel educativo con /e/ en porcentajes

Efectivamente, se observa un favorecimiento por parte de los hombres en todos los

niveles educativos, aunque en el universitario la diferencia no es muy grande. Nótese

también que a mayor nivel educativo, mayor producción de diptongos con deslizada

media tanto por hombres como por mujeres.

133
4.2.3 Variante formación de diptongo con deslizada alta

Total N: 240/1151 Input 0.122 Log likelihood = -483.654

Probabilidad % diptongos /j/ Total N % Datos


Acento
V2 .75 32 617 54
V3 .50 15 264 23
V1 .07 1 270 23
Rango: 74
Edad
56-65 . 64 32 144 12
25-35 .53 23 341 30
36-55 .49 20 334 29
18-24 .40 15 332 29
Rango: 24
Nivel educativo
Primaria y secundaria .58 28 427 37
Preparatoria .49 19 332 29
Universidad .40 14 392 34
Rango: 18
Tipo de sílaba
Abierta .55 24 796 69
Cerrada .37 14 355 31
Rango: 18
Sexo
Mujer .57 25 604 53
Hombre .42 16 547 47
Rango: 15

Tabla 16. Factores que contribuyen a la selección de la variante /j/ (diptongo con deslizada alta)

La estrategia formación de diptongo con deslizada alta resultó ser la tercera más usada

por la muestra de este estudio. Con esta variante se identificaron también factores

externos y internos que condicionan esta estrategia. Entre las variables lingüísticas

tenemos el acento y el tipo de sílaba, mientras que entre las externas se incluyen la edad,

el nivel educativo y el sexo.

134
Analizando los factores internos, se observa que el acento en la segunda vocal de la

secuencia favorece mucho la presencia de esta estrategia en cuestión. También el acento

en una tercera vocal parece mostrar esta tendencia, aunque su peso es menor que el de la

segunda vocal. Dentro del tipo de sílaba, son las abiertas las que favorecen la

diptongación con deslizada alta. La tabla siguiente muestra la distribución entre estos

últimos factores:

Relación acento y tipo de sílaba


Total de observaciones : 1151 Valor de aplicación: /j/
N % N % N % N %

V1 V2 V3 Datos %

Cerrada 1/142 1 50/213 23 0 0 355 31

Abierta 2/128 2 147/404 36 40/264 15 796 69

Tabla 17. Variables vocal siguiente y tipo de sílaba

En realidad, la producción de diptongos con alta cuando el acento subyacente recae en la

V1 es casi nula independientemente del tipo de sílaba. Cuando la V2 es tónica, tenemos

un mayor número de observaciones, pero es la sílaba abierta la que favorece esta

estrategia. Cuando el acento se ubica en una tercera vocal, sólo se registraron casos con

sílaba abierta porque no tenemos secuencias vocálicas derivadas de verbos –ear en este

contexto y en sílaba cerrada. De ahí que las sílabas abiertas aparezcan como las

favorecedoras.

En cuanto a los factores externos, el grupo etario de 55-65 muestra el mayor peso,

seguido del grupo de 25-35 años, favoreciendo esta estrategia. Le siguen los subfactores

135
de primaria y secundaria, y las mujeres, en general. Abajo se presentan las relaciones

entre estas variables.

Relacion edad y nivel educativo

40
35

30
25
Porcentaje

Universidad
20 Preparatoria
15 Primaria y secundaria

10
5
0
18-24 25-35 36-55 56-65
Grupos etarios

Figura 32. Relación edad y nivel educativo con /j/

En efecto, se observa que el grupo de primaria y secundaria presenta los mayores

porcentajes de producción de esta variante /j/ en todos los grupos etarios en comparación

con los otros niveles educativos. En realidad, la tendencia parece ser que a menor nivel

educativo, mayor número de casos de deslizada alta, aunque esto no es contundente

porque no se contaron con informantes de preparatoria de 56-65 años y en el grupo de 18-

24, los del nivel de universidad producen ligeramente más esta variante que los de

preparatoria.

Comparando esta variante en los niveles educativos y los diferentes grupos etarios, se

advierte que las personas con universidad y posgrado no muestran gran variación de un

136
grupo etario a otro y tampoco hay un patrón de crecimiento o decremento. En el caso del

nivel preparatoria, los más jóvenes (18-24) producen menos que los otros grupos, pero es

el de 25-35 el que destaca con más ocurrencias. Con el nivel primaria, sucede algo

similar, pero con una variación: los grupos que más producen diptongos con alta son el de

25-35 y el de 55-65. En general, se nota que a mayor edad, hay más presencia de

diptongos con deslizada alta.

Analizando las variables sexo y nivel educativo, presentamos la siguiente tabla:

Relación sexo y nivel educativo


Total de observaciones con valor de aplicación /j/ : 1151
N % N % Datos %
Mujeres Hombres Totales
Universidad 30/185 16% 27/207 6% 392/34%

Preparatoria 43/174 25% 21/158 13% 332/29%

Primaria y sec. 80/245 33% 39/182 21% 427/31%

Totales 153/604 21% 87/547 16%

Tabla 18. Variables sexo y nivel educativo con /j/

Las mujeres favorecen más esta variante que los hombres en general en todos los niveles

educativos. De hecho, se nota también que, en el caso de las mujeres, la producción de la

deslizada alta se incrementa conforme el nivel educativo baja. Es decir, hay una relación

inversa: a mayor nivel educativo, menos diptongos con alta; pero a menor nivel, más

casos de /j/. Con los hombres, la situación es un poco diferente: su uso de esta estrategia

es igual en los niveles de preparatoria y universidad, pero ésta es mayor en el nivel de

137
primaria y secundaria. Así se confirma que es el nivel de primaria y secundaria con

ambos sexos el que produce más diptongos con deslizada alta.

Finalmente veamos qué ocurre con las variables sexo y edad a través de la tabla aquí

abajo:

Relación sexo y edad


Total de observaciones : 1151 Valor de aplicación: /j/
N % N % N %

Mujeres Hombres Totales datos


18-24 27/174 16 22/158 14 332 29

25-35 60 /184 33 18/157 11 341 30

36-55 45/188 24 22/146 15 334 29

56-65 21/58 36 25/86 29 144 12

Tabla 19. Variables sexo y edad con /j/

Una vez más se confirma que las mujeres favorecen más que los hombres, pero aquí

conviene notar que en el grupo de 18-24 la diferencia entre hombres y mujeres es

mínima. Sin embargo, ésta se va incrementando según aumenta la edad. El mayor margen

se presenta en el grupo de 25-35 en el que la diferencia entre mujeres y hombres es del

22%. Cabe señalar también que la producción de esta estrategia en los hombres es mayor

en el grupo de 56-65, igual que ocurre con las mujeres. Así, ambos sexos se comportan

de manera similar: los más jóvenes producen menos; el grupo de los mayores producen

más deslizadas altas.

Finalmente, veamos la relación entre las variables acento (lingüística) y el nivel

educativo (social):
138
Relacion acento y nivel educativo
50

40

30 Prim. y sec.
20 Preparatoria

10 Universidad

0
V1 V2 V3

Figura 33. Relación acento y nivel educativo con variante /j/

Sin considerar el acento en la V1, la gráfica muestra una clara estratificación por nivel

educativo cuando el acento está en V2 y V3. Es decir, en ambos contextos se evidencia el

determinante papel del nivel educativo en la producción de esta variante. Con la V2 todos

los niveles educativos producen más /j/ que con la V3, pero cada nivel educativo

mantiene la misma jerarquía constante con respecto a los otros grupos en los diferentes

contextos: a mayor nivel educativo, menor número de /j/.

4.2.4. Variante elisión

Se registraron sólo 101 casos de elisión y la prueba arrojó tres variables lingüísticas y una

externa como condicionantes de la variante de elisión. Sin embargo, dado que se

observan algunos traslapes e inconsistencias en la prueba estadística, trataremos esta

variante más con un carácter cualitativo. Entre los internos, el que registra un mayor peso

es la calidad de la vocal siguiente seguido del acento y del tipo de sílaba. Como factor

externo, la prueba de transformación resultó favorecer esta estrategia. De esta manera,

139
resulta que la /e/ es la vocal siguiente que favorece enormemente la elisión. Esto significa

que, dado que en los verbos –ear la primera vocal es /e/, ante otra vocal de igual calidad,

la tendencia es a elidir una de ellas. Cabe aclarar aquí que aunque hablamos de elisión, en

la mayoría de los casos (90%) lo que se observó fue un alargamiento vocálico de /e/.

El acento una vez resultó ser un factor determinante en la selección de estrategias de

resolución. En el caso de elisión, ocurre que el acento en la tercera vocal favorece dicha

estrategia. Y en el tipo de sílaba, la cerrada tiene un peso significativo.

La vocal /e/ destaca sobre manera en comparación con las otras vocales produciendo

casos de elisión cuando le sigue a la /e/ de los verbos –ear y cuando la V2 es tónica. Es

decir, se entiende entonces que la vocal elidida es la primera /e/ que es átona. De hecho,

en los pocos casos registrados de elisión con las vocales /a o/ la vocal elidida fue en todos

los casos la /e/ de la base del verbo -ear. Dado que la V1 fue arrojada como knock-out por

el programa de GoldVarb, se entiende entonces que cuando la V1 es tónica se inhibe esta

estrategia.

4.2.5 Variantes hiato con vocal alta /i/ y fusión

Las estrategias hiato con /i/ y fusión registraron un porcentaje tan bajo (2% y 1%,

respectivamente) que resulta insuficiente para derivar tendencias o probabilidades. Sin

embargo, podemos señalar que sobre la producción de hiatos con /i/, las observaciones

computadas se asocian con los niveles educativos más bajos y con mujeres.

Con respecto a la fusión (del contacto de las vocales los hablantes realizan otra vocal

distinta de éstas), es conveniente aclarar que las vocales o resultantes eran vocales

difíciles de clasificar porque no se correspondían con las vocales subyacentes; es decir, se


140
trata de vocales que requieren un estudio acústico y espectrográfico detallado para poder

clasificarlas. Esta estrategia parece realizarse más cuando el acento se ubica en la tercera

vocal, y que son los verbos en participio, futuro, imperfecto e infinitivo donde se

evidencia el uso de la elisión.

Hasta aquí hemos presentado cada una de las estrategias de resolución empeladas por los

informantes en este estudio. Concentrándonos en las más relevantes, abajo se ilustra

comparativamente cada una de estas estrategias con los factores condicionantes de cada

una de ellas:

141
Variables Hiato con /e/ Diptongo con Diptongo con
media alta
Acento
V1 .97 .12 .07
V2 .27 .75
V3 .19 .50
V2 y V3 .64
Rango: 78 Rango: 52 Rango 74

Edad
18-24 .57 .57 .40
25-35 .37 .54 .53
36-55 .51 .46 .49
56-65 .58 .31 .64
Rango: 21 Rango: 26 Rango: 24

Instrumento
Entrevista .30 .65
Sombreado .43
Transformación .52
Sombreado y .52
transformación
Rango: 22 Rango: 22

Nivel educativo
Primaria y sec. .40 .58
Preparatoria .47 .49
Universidad y .62 .40
posgrado
Rango: 22 Rango: 18

Sexo
Mujer .41 .57
Hombre .59 .42
Rango: 18 Rango:15

Grado de
sonoridad
Creciente .58 .60
Constante .38 .25
Rango: 20 Rango: 35

Tipo de sílaba
Abierta .55
Cerrada .37
Rango:18

Tabla 20. Tabla comparativa de estrategias con factores condionantes

142
Es de notarse que el acento es un factor presente en todas las estrategias y que en la

jerarquización de factores se encuentra en primer lugar. Distinguiendo la vocal que recibe

el acento, queda claro que cuando el acento recae en la V1, éste favorece casi

exclusivamente el mantenimiento del hiato, pues es la única variante constreñida por esta

condicionante. Por otra parte, si V2 es tónica, las estrategias probables son formación de

diptongo con deslizada alta seguida de diptongación con formación de deslizada media.

Finalmente, si la vocal acentuada es otra que no está en la secuencia vocálica (V3), hay

probabilidades de que ocurra cualquiera de las estrategias aquí analizadas, salvo el

mantenimiento del hiato.

La edad resultó ser uno de los factores sociales con mayor impacto en las estrategias,

pues está presente en las estrategias de mayor uso. En el mantenimiento del hiato se ubica

en el rango tres de cuatro; en diptongos con deslizada media está en el tres de seis, y en la

diptongación con alta es el segundo de cinco. Así, parece ser que en general la edad es un

factor externo con un papel determinante en la selección de una u otra estrategia. Si

analizamos con detalle, se observa que en el mantenimiento del hiato en general todos los

grupos favorecen esta estrategia excepto el grupo de 25-35 años; la diptongación con

deslizada media es principalmente acogida por los grupos etarios más jóvenes (18-35),

mientras que la diptongación con deslizada alta es favorecida principalmente por el grupo

más viejo, aunque también el grupo de 25-35 muestra esta tendencia.

El instrumento también es otro factor interno que afecta la resolución de hiatos, pues se

muestra como condicionante en el mantenimiento del hiato y en diptongación con

deslizada media. Hay, sin embargo, una ligera variación: las pruebas favorecen el hiato,

143
mientras que la entrevista favorece los diptongos con media. También la prueba de

transformación favorece esta estrategia.

El grado de sonoridad resultó relevante también en estas mismas estrategias de

resolución, aunque en jerarquías diferentes: en la heterosilabificación se ubica en la

posición cuatro, pero en la diptongación con media está en segundo lugar. Es la sonoridad

creciente la que favorece ambas estrategias.

Entre los factores sociales, también el nivel educativo parece tener efectos en la

resolución de hiatos. Se presenta en dos estrategias: formación de diptongo con media y

formación de diptongo con alta. En la primera, este factor ocupa la posición cinco de seis

en la jerarquía; en la segunda, es el tercero de cinco. Además de tener diferente rango en

la jerarquía, el nivel educativo integrado por tres subfactores: primaria y secundaria,

preparatoria, y universidad y posgrado parece dividirse en las estrategias. El grupo de

universidad y posgrado favorece la formación de deslizada con media mientras que el

grupo de primaria y secundaria favorece los diptongos con alta.

La variable sexo resultó condicionante en la formación de diptongo con media y con alta.

En ambas, se ubica en la última posición de la jerarquía de factores. Con esta variable se

observa un claro contraste en dichas estrategias: mientras los hombres favorecen los

diptongos con deslizada media, las mujeres muestran una tendencia a favorecer los

diptongos con deslizada alta.

Finalmente, el tipo de sílaba es un factor lingüístico que condiciona solamente la

estrategia de diptongación con deslizada alta, ubicándose en el penúltimo lugar en la lista

de factores. Son las sílabas abiertas las que favorecen esta estrategia.

144
En resumen, se advierte que estas estrategias están condicionadas tanto por factores

lingüísticos como sociales: el mantenimiento muestra dos de cada tipo; los diptongos con

media presentan más factores externos (4) que lingüísticos (2); y los diptongos con alta

también (3 externos y dos internos). Abajo presentamos un resumen de factores

jerarquizados para cada estrategia:

Hiato con /e/ Diptongo con media Diptongo con alta


1.Acento 1.Acento 1.Acento
2. Instrumento 2. Grado de sonoridad 2.Edad
3. Edad 3. Edad 3. Nivel educativo
4.Grado de sonoridad 4.Instrumento 4. Tipo de sílaba
5.Nivel educativo 5. Sexo
6. Sexo

Tabla 21. Resumen de grupos factoriales significativos por estrategia de resolución

En las páginas siguientes discutimos estos resultados en relación con los objetivos e

hipótesis planteados para este estudio.

4.3 Discusión de los resultados

Dado que uno de los objetivos de este estudio era identificar las estrategias usadas para

resolver los hiatos en los verbos –ear en español mexicano, los resultados arrojaron seis

estrategias en lugar de las cuatro planteadas inicialmente: mantenimiento del hiato,

formación de diptongo con deslizada media, formación de diptongo con deslizada alta,

elisión, hiato con /i/ y fusión vocálica. Como los resultados muestran, la estrategia de

145
resolución de hiato más utilizada en los verbos –ear por esta muestra fue la de formación

de diptongo con deslizada media, pero si la agrupamos junto con la diptongación con

deslizada alta, la suma se hace de 60%. Este resultado confirma nuestra hipótesis de que

la formación de diptongo es la resolución de hiato más utilizada en los verbos –ear en en

esta muestra estudiada, y coincide con el estudio de Perissinotto (1975) en la Ciudad de

México, con el de Jenkins (1999) en el español de Nuevo México y con el de Garrido

(2007) en el español caribeño colombiano, aunque estos estudios no se enfocaron

específicamente en las secuencias vocálicas de los verbos –ear.

No obstante las cifras de diptongación, el mantenimiento del hiato resultó la segunda

estrategia más utilizada con un 28%. Esto evidencia la tendencia antihiática de la que se

habla en la literatura, pero al mismo tiempo es un indicador de la resistencia a mantener

esta variante en determinados contextos. Vuskovich (2006) encontró en su estudio en la

Ciudad de México que el mantenimiento era la estrategia más usada seguida después de

diptongación tanto de media y alta, y después por elisión. Aguilar (2006) tuvo hallazgos

similares en el español peninsular: heterosilabificación seguida de diptongación y elisión

al final. Sin embargo, conviene aclarar que ambos fueron estudios en el nivel postléxico y

con diferentes secuencias vocálicas. Lo coincidente con estos estudios, además de con el

de Sanicky (1989), es que la estrategia de elisión es también la tercera en la escala de uso

en nuestra muestra, si agrupamos los diptongos. Para Jenkins (1999), la elisión se colocó

en segundo lugar y el mantenimiento del hiato en tercero en el español de Nuevo México.

La estrategia de hiato con /i/ parece ser novedosa porque no se han registrado casos en la

literatura. En realidad, en este estudio no se tenía planteada como variante, pero fue con

el análisis acústico que nos percatamos de su presencia. Aunque su producción es muy

146
reducida, ésta puede indicar algo: puede ser que los hablantes piensen que están usando

un verbo –iar en vez de -ear y después como hipercorrección hagan un hiato.

La fusión vocálica resultó ser la estrategia menos usada por nuestra muestra. En realidad

esta estrategia no ha sido reportada en estudios previos, con la excepción de Jenkins

(1999) en su estudio de Nuevo México. Aunque la registramos por tener varios casos,

este tipo de resolución de hiatos puede interpretarse también como resultado de la rapidez

del habla del informante o por una equivocada articulación de los segmentos que se da

por nerviosismo.

Nuestro segundo objetivo con este estudio era analizar los factores internos y externos

que condicionan las estrategias de resolución de hiato. En el análisis de resultados

arrojados por Goldvarb se jerarquizaron dichos factores según la estrategia empleada. El

acento resultó ser el factor de mayor peso en todas las estrategias, pero donde tiene un

papel fundamental es en el mantenimiento del hiato porque cuando la V1 es tónica, es

decir la /e/ del verbo, la probabilidad de mantener el hiato es casi total. Esto coincide con

la propuesta de Martínez-Gil (2000) y Morris (1998) de que en el dialecto mexicano las

vocales tónicas tienden a mantenerse como nucleares. Por otra parte, cuando el acento

recae en la segunda o tercera vocal, las probabilidades de usar otra estrategia de

resolución es muy grande. Estos resultados apoyan así nuestra hipótesis de que el acento

es la principal condicionante lingüística que inhibe la formación de diptongos, ya que las

vocales que reciben acento son más resistentes a los cambios. De hecho, cuando el acento

recae en la V2 o la V3, el cambio que se efectúa, ya sea por diptongación o por elisión,

generalmente ocurre en la vocal átona que en este caso es la /e/, la cual se vuelve

deslizada media o alta o se elide.

147
Pero entonces, la pregunta que seguramente surge es ¿por qué la V1 con la variante

mantenimiento del hiato no tuvo un cien por ciento? Esto sucede porque se registraron

casos de traslación o dislocación acentual (10%). Es decir, los hablantes cambiaron el

acento de V1 a V2 y recurrieron a otras estrategias de resolución. Por ejemplo, una forma

que presentó traslación acentual fue el verbo “parrandear” de presente en primera

persona. Así, en vez de decir “yo parrandeo por el boulevard”, algunos hablantes

terminaron diciendo “yo parrandeó por el boulevard”. Otro verbo también con cambio de

acento fue “besuquear” en presente en tercera persona de plural: “Mis amigos se

besuquean…”, el cual fue producido por algunos hablantes como una palabra oxítona en

vez de paroxítona. En consecuencia, estas dislocaciones acentuales causaron que ese peso

no fuera del 100%. Esta menor presencia de casos de traslación acentual confirma nuestra

hipótesis de que la traslación acentual en español mexicano no es favorecida. Además,

este resultado coincide con Morris (1998) y Martínez-Gil (2000) en su estudio

comparando el español chicano, mexicano y peninsular donde señalan que mientras que

la traslación acentual en el español chicano y el peninsular es posible, el español

mexicano no acepta tal cambio acentual. Sin embargo, tampoco podemos negar la

existencia de traslación acentual porque sí hay casos y esta variación puede ser el

principio de un cambio que afecte la reducción de la estrategia de mantenimiento del

hiato.

La variable calidad de las vocales no resultó un factor significativo, pero esto sucede

porque se observaron traslapes con las variables tipo de sílaba y grado sonoridad, que se

relacionan mucho. La vocal siguiente /e/, por ejemplo, resultó favorecer tanto los

diptongos con alta como la elisión. Este hecho de tener el mismo contexto fonético, pero

148
tener por lo menos dos posibilidades de resolución no coincide totalmente con lo que

ocurre en español chicano donde, según Martínez-Gil (2002) y Bakovic (2007), en el

nivel postléxico ante dos vocales idénticas sucede que una se elide. Más adelante, cuando

se aborden las variables sociales, ejemplificaremos este caso. Por ahora, podemos decir

que nuestra hipótesis sobre la calidad de las vocales: “en el caso de vocales idénticas en

contacto con los verbos –ear, no ocurre que una se elida; sino que formará diptongo”, se

confirma parcialmente porque es cierto que hay una gran probabilidad de que la

estrategia a usar sea la de diptongación con deslizada alta; sin embargo, también puede

ocurrir que se aplique la estrategia de elisión.

Pasando ahora a la variable tipo de sílaba, nuestros resultados muestran que este factor

sólo condiciona la diptongación con alta, pues las sílabas abiertas la favorecen. En las

otras estrategias este factor no tuvo un papel significativo, pero atendiendo este resultado,

se rechaza la hipótesis propuesta de que las sílabas abiertas favorecen el mantenimiento

del hiato.

El grado de sonoridad de las vocales subyacente resultó significativo en el mantenimiento

del hiato y en los diptongos con media. Ambas estrategias se favorecen si incluyen

secuencias con sonoridad creciente, pero la posición del acento es lo que marca

principalmente la gran diferencia del uso de una u otra estrategia. Cabe aclarar que el

grado de sonoridad usado en las pruebas estadísticas fue el de las vocales subyacentes, y

sólo con /a/ se tiene un grado creciente; con /e/ y /o/, el grado es constante. Sin embargo,

cuando se aplica la estrategia de diptongación o elisión, la secuencia de vocoides o el la

sílaba resultante producen una sonoridad creciente.

149
Esto es, si consideramos la escala de sonoridad propuesta por Jany et al (2007) y Núñez

Cedeño y Morales-Front (1999) en la que las deslizadas están en un nivel abajo de las

vocales, con estas estrategias se evidencia esta preferencia por secuencias de vocoides de

sonoridad creciente. Este favoreciemiento, sin emabrgo, está supeditado al acento, ya que

los hiatos, se mantienen aunque presenten una sonoridad constante o creciente. Estos

hallazgos conllevan a aceptar nuestra hipótesis de que en “español mexicano hay una

tendencia a evitar secuencias vocálicas con sonoridad constante; es decir, se prefiere una

secuencia vocálica cuyos elementos se distingan lo más posible en cuanto a sonoridad”.

En cuanto a las variables sociales, es claro que la resolución de hiatos en nuestra muestra

es un fenómeno condicionado socialmente, aunque llama la atención que unas estrategias

tienen más restricciones que otras. Es de notar que la edad es uno de los factores más

relevantes en este fenómeno. Estos resultados contrastan con los de Perissinoto (1975) en

la Ciudad de México, pues la edad no resultó significativa en su estudio. A grandes

rasgos en el presente estudio parece que los más jóvenes favorecen la diptongación con

deslizada media y los mayores, la diptongación con deslizada alta. El grupo de 25 a 35

muestra tendencias disímiles porque aunque es un grupo joven que también favorece los

diptongos con alta. Por otra parte, todos favorecen la retención del hiato, salvo dicho

grupo. Estos resultados también presentan grandes diferencias con respecto al estudio de

Vuskovich (2006) pues en éste las personas mayores produjeron más hiatos que los otros

grupos más jóvenes. Las diferencias encontradas con el grupo de 25-35 pueden

interpretarse también si miramos el nivel educativo y el sexo, que pueden estar

interactuando. Las mujeres en este grupo produjeron más diptongos con alta y también

los de niveles educativos bajos. Es decir, parece que en este grupo etario las mujeres de

150
niveles educativos bajos, pero quizás ya en el mercado lingüístico favorecen esta

variante.

En una visión global y prescriptiva, es evidente la variación existente en la resolución de

hiatos teniendo como variante estándar el mantenimiento del hiato y el resto como las no

estándar. Sin embargo, dentro de éstas se muestra una gradación de tendencias bien

diferenciadas tanto por factores lingüísticos como sociales o externos. En este grupo de

variantes “no estándar”, la formación de diptongo en general es la más favorecida,

seguida de elisión. De éstas, la diptongación es la más condicionada socialmente. Por

ello, nos enfocamos en la interpretación de esta variante y su función en la comunidad de

habla estudiada.

Como es bien sabido, la diptongación como estrategia de resolución ha sido documentada

repetidamente en estudios de dialectología o de pronunciación del español. No obstante,

al hablar de diptongación en estos textos es la deslizada alta [j] el vocoide al que se hace

referencia como resultado del contacto de vocales en las secuencias /e/ + V: [patjé],

[boltjó]. Es decir, basándonos en el registro desde hace mucho tiempo de la estrategia de

resolución mediante la diptongación con deslizada alta en la literatura, parece ser que fue

una de las que iniciaron el camino para evitar los hiatos. En el presente estudio, resulta

interesante que son las personas de edad mayor, las mujeres y los niveles educativos más

bajos (primaria y secundaria), los que favorecen esta variante. Tiene sentido entonces

pensar que son las mujeres las que lideraron o lideran aún esta variante como una

oposición al mantenimiento del hiato. Recordando que en algunos estudios se reporta que

incluso los hablantes cultos recurren a esta estrategia (Navarro Tomás, 1990; Matluck,

1995; Moreno de Alba, 1994), es probable que como variante innovadora, en su

151
momento, haya sido parte de un cambio promovido por las mujeres de los grupos medios

y después se haya difundido a los otros.

A pesar de ser una variante con gran frecuencia de uso, esta estrategia se ha identificado

en la literatura generalmente con gente rural o inculta por ser, obviamente, una variante

no estándar. Podemos suponer entonces que la formación de diptongo con media surge

como una estrategia intermedia entre la estándar (el mantenimiento de la secuencia

heterosilábica) y el diptongo con deslizada alta; es decir, ante una variante no estándar

que está siendo estigmatizada, hay una reacción para evitarla. Esto es lo que Chambers y

Trudgill (1980: 135) llaman una variante “fudge… a phonetic compromise between the

standard and the innovative variant that, in effect, allows users to avoid choosing between

them”.

De esta manera, tenemos que el nivel educativo más alto (universidad y posgrado) y los

hombres son los que favorecen esta nueva estrategia de resolución. Y es lógico pensar

que sea el nivel educativo más alto el que reacciona ante la estigmatización de la

diptongación con alta, pero lo interesante aquí es que la innovación se da con el

surgimiento de otra estrategia de resolución y no con el incremento de producción de

hiatos. Esto puede interpretarse como una preferencia antihiática en general, y el

mantenimiento de hiatos puede explicarse en términos lingüísticos, pues como lo indican

los resultados el acento en este dialecto desempeña una función fundamental y casi todos

los grupos etarios lo favorecen.

Volviendo a la variante de formación de diptongo con deslizada media, la variante

intermedia más reciente, podemos interpretarla en dos fases: primero surge como una

152
reacción contra la diptongación con alta en el nivel educativo alto liderada por hombres.

Y parece ser un cambio desde arriba o consciente. Como las gráficas claramente ilustran,

es una variante opuesta a la diptongación con alta la cual es favorecida por mujeres y los

niveles educativos bajos. Se observa que la diptongación con media es una variante

claramente estratificada, ya que la tendencia por esta variante se reduce de manera

constante según se baja en la escala de niveles educativos.

No obstante, esta estratificación no se muestra en el tipo de instrumento usado, pues la

entrevista y la prueba de transformación favorecen esta variante innovadora. Esta

situación parece indicar un uso generalizado o extendido en el habla de los informantes,

en los estilos o tipo de comunicación implicados en estos instrumentos. Es decir, tanto en

un contexto más natural (la entrevista) como en uno más artificial (la prueba de

transformación) los hablantes favorecen la deslizada media. La prueba de sombreado

desfavorece esta variante, pero suponer que es por una mayor atención o monitoreo no es

la mejor interpretación porque simplemente puede ser que los hablantes dividan su

producción entre otras estrategias y no únicamente entre la variante “estándar”. Esta

variante puede estar interactuando con los otros factores sociales.

Contrario a lo que sucede frecuentemente en la mayoría de los cambios lingüísticos en los

que la mujer es la líder, esta variante intermedia es promovida por los hombres en todos

los niveles educativos. Esto quizás pueda interpretarse mirando la situación

socioeconómica, cultural y geográfica de la comunidad de habla. El Estado de Quintana

Roo es un estado declarado como tal apenas hace 100 años y Chetumal, su capital, es por

tanto una ciudad relativamente joven que ha ido creciendo principalmente por la

constante llegada de inmigrantes procedentes de otros estados, principalmente de la

153
península de Yucatán en un principio, y en años más recientes de estados del centro del

país. Hace 18 años Chetumal no contaba con universidades y el único centro de

educación profesional era la Escuela Normal de Bacalar que formaba maestros de jardín

de niños y primaria. Por ello, sólo las personas con posibilidades económicas y

disposición para residir en otro estado, podían estudiar la universidad. Siendo una cultura

en la que no se acostumbra que los hijos vivan lejos de los padres y menos las mujeres,

parece ser que los hombres eran los que con más frecuencia se iban a otros estados a

estudiar el nivel superior. Esto se articula bien con el hecho de que para las entrevistas de

este estudio fue imposible encontrar mujeres arriba de los 50 años con estudios de

universidad y posgrado que hayan obtenido su grado universitario de jóvenes; hombres sí

se encontraron. De hecho, fue difícil también encontrar informantes (hombres y mujeres)

de nivel preparatoria del grupo etario 55-65, lo cual indica que hace 40 años la educación

en la ciudad no rebasaba quizás el nivel de secundaria o eran pocos los que continuaban

estudiando.

Tenemos entonces, por un lado, que los hombres eran los que en su mayoría salían a

estudiar a otros estados. Por otra parte, con la llegada de inmigrantes del centro del país

puede haber habido un encuentro de dialectos y de estrategias de resolución de hiatos.

Recientemente, la inmigración ha sido del centro del país y si recordamos el estudio de

Vuskovich (2006) donde se reporta que la estrategia de mayor uso, después del

mantenimiento, es la diptongación con deslizada media, podemos encontrar quizás una

conexión por aquí. También ocurre que con la apertura de la universidad pública y de

otras universidades privadas en fechas recientes, la contratación de profesores e

investigadores provenientes de otros estados también se ha incrementado. Las actividades

154
en el gobierno han aumentado y en los diferentes sectores públicos y privados también se

ha notado un incremento de contratación de personas inmigrantes que cuentan con

credenciales específicas para desempeñarse en tal o cual trabajo. De esta manera,

tenemos que los hombres que vuelven a Chetumal han tenido contacto con otros

dialectos, y los inmigrantes han traído su propio dialecto. Además, si consideramos que

en la Ciudad de México la formación de deslizada es la estrategia de resolución de mayor

uso (después del mantenimiento del hiato) liderada por hombres, como Vuskovich (2006)

señala, puede ser que ésta variante se esté difundiendo en otros estados pues esta ciudad

es la capital del país donde se concentran muchas universidades y centros culturales,

oficinas centrales de muchas instituciones y comercios, las principales televisoras y

radiodifusoras del país que transmiten al resto de los estados. Puede ocurrir que los

medios masivos de comunicación estén afectando o acelerando este cambio.

Por todo lo anterior, podemos suponer que esta estrategia de formación de deslizada

media es una variante que se ha difundido por diferentes medios y que ha sido promovida

por hombres en un nivel más “global”; es decir, la preferencia de las mujeres por la

variante diptongación con deslizada alta, que puede considerarse una variante local, no

coincide con la variante considerada en un nivel mayor, más global, como más

prestigiosa.

Hasta aquí tenemos la primera fase que mencionamos previamente: la diptongación con

deslizada media parece ser un cambio que llegó a ser una variante estable, pues muestra

correlaciones regulares con el nivel educativo ordenando su frecuencia de uso de acuerdo

con la jerarquización educativa; y hay diferencias entre mujeres y hombres.

Adicionalmente, con respecto a las evaluaciones subjetivas hacia esta variante, en general

155
parece haber una conciencia lingüística sobre esta diferencia de prestigio entre las

variantes de la diptongación.

Pero parece haber una segunda fase. En el presente estudio, la edad resultó uno de los

factores sociales más acusados en las estadísticas; es decir, fue el factor social que

condiciona casi todas las estrategias de resolución de hiatos y, como bien se sabe en la

literatura variacionista, la edad es el principal correlato social indicador de cambio

lingüístico. Los grupos más jóvenes (18-35 años) favorecen esta variante, pero si

revisamos la curva en la gráfica, ésta va en descenso conforme se avanza en edad. La

estratificación según el nivel educativo se mantiene constante, pero se correlaciona con la

edad también. En otras palabras, los niveles de primaria y secundaria y el de preparatoria

presentan una frecuencia de uso mayor de la variante innovadora conforme la edad se

reduce. El nivel de universidad tiene una frecuencia de uso mayor en los grupos de 25-35

y 36-55. Esto último puede interpretarse en términos de mercado lingüístico, pues es la

etapa de la vida productiva de los individuos en la que el uso de variantes de prestigio

tiene mayor cabida. Sin embargo, el grupo más joven (18-24) resultó también

favorecedor de esta variante.

Consecuentemente, parece ser que ya no estamos ante una variable estable y hay una

segunda fase, pues la frecuencia de uso entre jóvenes y personas mayores no es la misma

en el mismo nivel educativo. Generalmente, ante una variable estable, los informantes de

una misma clase social presentan la misma frecuencia de uso sin importar la edad, o las

diferencias son mínimas. Parece ser, por tanto, que estamos ante un cambio en curso en el

que las personas mayores registran en menor proporción la variante innovadora que los

informantes jóvenes. El aumento en el porcentaje de la variante formación de diptongo

156
con deslizada media entre los más jóvenes y la estratificación por edad opuesta que se

identifica en la variante diptongación con deslizada alta permite suponer un cambio en

marcha incipiente.

Pensamos que no se trata de un fenómeno generacional porque las frecuencias de uso de

la variante de los mayores no se mantienen en los jóvenes. Ante un cambio, la variante de

los padres se presenta en los hijos con mayor frecuencia y así sucesivas generaciones

muestran mayores incrementos en la variante innovadora. Tampoco suponemos que sea

una variable de gradación por edad porque son tres grupos etarios los que muestran altos

porcentajes de uso de la variante.

Finalmente, el hecho de que las mujeres de nivel educativo universitario y del grupo más

joven (18-24) mantenga casi la misma frecuencia de uso que los hombres de esos mismos

grupos puede interpretarse de dos formas: significa que es una variable estable y que en

los siguientes niveles la diferencia entre hombres y mujeres se hace más aguda, o que las

mujeres también están aceptando la variante innovadora y que en generaciones sucesivas

el número de mujeres produciendo dicha variante se incrementará en los siguientes

grupos etarios. Por toda la situación socio-económica, cultural, y demográfica de la

comunidad de habla, todo apunta hacia lo segundo apoyando nuestra suposición de un

cambio en marcha.

Comparando la variante de diptongo con deslizada media con la de diptongo con

deslizada alta, vemos una oposición regular. Las mujeres, el nivel educativo más bajo y el

grupo etario mayor favorecen la deslizada alta. Algo interesante aquí, sin embargo, es que

el grupo de 25 a 35 también parece favorecerla. La diferencia puede radicar en factores

157
lingüísticos más que en sociales. Si observamos bien los factores que determinan el uso

de uno u otro vocoide (medio o alto) son un tanto opuestos. El acento en la V3 tiene

mayor peso en la diptongación con media seguida de acento en V2, pero en la

diptongación con alta es la V2 tónica la que tiene mayor peso y después le sigue la V3

acentuada. Por otra parte, la vocal /e/ como vocal siguiente resultó favorecedora de la

diptongación con alta. Esto se traduce que en formas verbales con dos vocales idénticas

/e e/ hay una gran probabilidad de que la primera vocal se eleve y se forme una deslizada

alta en contacto con la otra vocal /e/, pues no encontramos deslizadas medias junto a una

vocal media idéntica en este dialecto.

Otra posibilidad de resolver el hiato de vocales idénticas /e e/ es mediante elisión, la cual

es favorecida casi totalmente por este tipo de secuencias. A diferencia del diptongo con

alta, el peso aquí es mayor cuando el acento recae en la V3 y cuando las sílabas son

cerradas. Pero las cosas no son tan sencillas porque se encontraron intersecciones en el

uso de estas dos estrategias. Por ejemplo, hubo hablantes que pronunciaban [patjé] y

otros [paté:]. Además, parece haber un efecto léxico también porque el imperativo plural

“cacheteemos” se realizó en un 90% con diptongo con alta por todos los informantes,

pero el imperativo singular negativo de “No zarandees” y “No chiquees” se produjo con

elisión un 90%. Las formas “coqueteé” y “golpeé” se produjeron con alta un 95%.

Estas diferencias pueden explicarse probablemente como efectos de frecuencia de uso

(Bybee, 2001). Si consideramos la frecuencia de ítem (token en inglés) y la frecuencia de

su tipo, en efecto los verbos que se realizaron con alta son mucho más frecuentes. Por

ejemplo, en el Corpus del Español de Davies (2002), golpear tiene una frecuencia de

16.7, mientras zarandear tiene 0.06. Por otra parte, las formas en pasado son más

158
frecuentes que las de imperativo. De acuerdo con Bybee (2001), los cambios fonéticos

ocurren más rápidamente con ítems de alta frecuencia que con ítems de baja frecuencia.

Ya Alba (2006) en su estudio de resolución de hiatos en el español de Nuevo México,

con un enfoque de fonología basada en el uso de Bybee, había encontrado que los

factores estructurales y de frecuencia desempeñan un papel significativo en la definición

de la resolución de hiatos, aunque su investigación fue en el nivel postléxico y con la

secuencia vocálica /a/ + V (cualquier vocal).

Con la selección de estrategia cuando tenemos dos vocales idénticas, por tanto, ocurre

que, por una parte tenemos los factores internos condicionando las estrategias, pero por

otro, tenemos los factores sociales en el caso de diptongo con alta, y además el efecto de

frecuencia de uso de los verbos. Los ítems de alta frecuencia probablemente se realicen

con diptongo con deslizada alta, y los menos frecuentes quizás pasen por un proceso de

elisión. El hecho de que los informantes de 25-35 años favorezcan la diptongación con

deslizada alta puede interpretarse como una forma en la que las mujeres, principalmente,

desean valorar la variante local, y dadas las condiciones estructurales propicias para

hacerlo, pues se crea esta tendencia. Este grupo puede conformarse de mujeres amas de

casa o estudiantes de posgrado, o personas activas en el mercado laboral que muestran

preferencia por la variante local.

Una estrategia que resultó inesperada, pero existente en la comunidad de habla, es el

mantenimiento del hiato con /i/. Igual que con la formación de diptongos con alta, las

mujeres favorecen esta estrategia y los niveles de primaria y secundaria y preparatoria.

Este fenómeno puede entenderse en términos de hipercorrección a favor de la variante

local, pero con mezcla de hipercorrección a favor del mantenimiento del hiato en vez de

159
la diptongación. El porcentaje de este fenómeno fue mínimo, pero es indicador de la

inestabilidad de las estrategias. En otras palabras, la gente produce o escucha formas de

verbos –ear con formación de deslizada alta [koketjé], [patjó] y puede pensar que son

verbos del tipo –iar y no –ear. En consecuencia producen todas las formas con diptongo

con alta. Pero hay algunos hablantes que inconscientemente saben que el hiato es la

forma prestigiosa y entonces realizan hiatos con alta. Este fenómeno puede estar

ocurriendo por ajustes en la conformación silábica de diptongos o hiatos; los hablantes

probablemente prefieren secuencias vocálicas de sonoridad creciente en vez de sonoridad

constante.

Esta estrategia de mantenimiento del hiato con /i/ parece lo contrario de otro fenómeno de

hipercorrección que, aunque no se presentó en los datos recogidos en la entrevista, sí se

escucha en algunos hablantes de la comunidad. Hay hablantes, sobre todo de niveles

medios bajos y medios que conjugan los verbos –iar como verbos –ear. Así, se escucha

“negocear” en vez de “negociar”, o “vacear” en vez de “vaciar”, “copear” por “copiar”,

entre otros. Parece ser que tras identificar la diptongación con deslizada alta en verbos –

ear como una variante no prestigiosa, de uso entre hablantes de nivel educativo bajo, o de

áreas rurales, los hablantes de niveles educativos medios y altos, o de clase media baja y

media -media tratan de evitar esa secuencia con deslizada alta y llegan al extremo de

suprimir esta estrategia de resolución que implica una alta incluso en los verbos donde la

forma estándar es un diptongo con deslizada alta, como es el caso de los verbos -iar. Este

fenómeno de hipercorrección demuestra el estado de conciencia que tienen los hablantes

ante la resolución de hiato con formación de diptongo con deslizada alta y cómo se ha

convertido o se está convirtiendo en un estereotipo.

160
Capitulo 5: Conclusiones y comentarios

5.1 Conclusiones

A través de este estudio se abordó el fenómeno de resolución de hiato en los verbos –ear

del español mexicano, en particular del español de Chetumal, una ciudad en el sureste de

México. En la literatura previa el fenómeno de la resolución de hiatos se ha abordado con

mayor frecuencia en el nivel postléxico y generalmente desde una perspectiva más bien

descriptiva, teórica o experimental, pero son muy escasos los estudios de hiatos en el

nivel léxico y con una perspectiva variacionista. De ahí la contribución del presente

estudio a la literatura.

Los objetivos planteados al inicio de este estudio fueron identificar las estrategias usadas

para resolver los hiatos en los verbos –ear en español mexicano y analizar los factores

internos y externos que condicionan dichas estrategias. Estudios previos sobre la

resolución de hiato se han enfocado principalmente en determinar las restricciones

lingüísticas en la resolución del hiato, las cuales se abordaron en el capítulo dos.

Obviamente, algunos de estos factores identificados en la literatura son aplicables sólo en

el nivel postléxico. Lo que la literatura en español sobre los hiatos no ha atendido en

general es la parte social, pues son casi inexistentes los estudios que incluyen variables

sociales. La tendencia ha sido investigar la velocidad o estilo como variable externa,

161
identificando mayor producción de hiatos a menor velocidad o con un estilo más formal

(más lento).

A partir de las estrategias y factores identificados en la literatura u observados en la

comunidad de habla, se postularon las hipótesis correspondientes. Para su comprobación,

se utilizó una combinación metodológica variacionista y fonética experimental, la cual

resultó apropiada pues permitió no tan sólo identificar las estrategias de resolución

existentes en la comunidad de habla, sino también analizar los factores lingüísticos

condicionantes de dichas estrategias y las restricciones sociales que afectan la resolución

de hiatos y los patrones de la variación existente. Dada la evidencia en la literatura sobre

la variación de la resolución de hiatos, este enfoque metodológico es apropiado para dar

respuesta a un fenómeno fonético en el que el significado lingüístico de la variable es el

mismo en sus distintas realizaciones (variantes) en la comunidad, pero éstas se constriñen

por factores internos y externos diferentes. El análisis cuantitativo de los estudios

variacionistas nos permite asimismo observar el efecto de los factores de manera

individual o simultáneamente. Además, por medio de análisis distributivos podemos

observar tendencias y patrones que conllevan al investigador a hacer las inferencias

pertinentes. Por otra parte, con el análisis acústico se establecieron correlatos acústicos

que facilitaron la identificación de la estrategia de manera más objetiva y precisa. Con

este estudio, fue posible una apertura a identificar cualquier estrategia y no limitarse a la

comparación de una o dos estrategias, lo cual nos permitió tener un panorama completo

del fenómeno. Los detalles metodológicos se presentaron en el capítulo tres.

162
En consonancia con la literatura, se identificaron casi las mismas estrategias, excepto el

hiato con /i/, pues ésta no se había establecido como una posible estrategia de resolución

en español. Por otra parte, si bien es cierto que la diptongación como estrategia de

resolución de hiato se ha reportado en diferentes dialectos del español desde hace ya

mucho tiempo, estos diptongos a los que se refieren implican un vocoide alto. Sólo

recientemente se ha empezado a discutir la presencia de diptongos con vocoides medios.

Sin embargo, el presente estudio es el primero en aportar evidencia empírica de

resolución de hiatos en el nivel léxico considerando ambas formas de diptongación (con

deslizada alta y media), entre otras estrategias, y factores sociales como educación, edad

y sexo, los cuales resultaron tener un papel fundamental en este fenómeno variable.

Además de establecer las estrategias de uso en la comunidad de habla estudiada, en esta

disertación se analizó la extensión de cada una de las variantes, así como las tendencias o

preferencias de los hablantes, las cuales se orientan en conjunto hacia la supresión de los

hiatos, siempre y cuando la vocal tónica no sea la V1 (la /e/ en este caso). Es decir, todo

parece indicar que en esta comunidad de habla se mantienen los hiatos por el relevante

papel que tiene el acento, pero la producción de estos hiatos se reduce al contexto de la

V1 como vocal tónica. Si comparamos el mantenimiento del hiato con las otras estrategias

de resolución, coincidimos con la sugerencia de Hualde y Chitoran (2007) de que el

español se encuentra en una etapa media en la evolución de los hiatos en dirección a la

diptongación. Esta comunidad de habla estudiada muestra tendencias antihiáticas que

apuntan hacia el favorecimiento de la diptongación principalmente, aunque también hay

otras estrategias como la elisión que contribuye a la supresión de hiatos.


163
Las inferencias obtenidas a partir de este estudio muestran diferencias con respecto a la

revisión de la literatura, en el sentido de que en ésta generalmente se contrapone el

mantenimiento del hiato a las formas de resolución que se desvían de la norma; es decir,

a las formas de resolución no estándar, a saber, diptongación, elisión, etc. Así, en la

literatura se habla de los porcentajes de hiatos vs. otras formas. Sin embargo, se ha

demostrado en este estudio que actualmente en esta comunidad de habla la competencia

más notable entre variantes se da entre dos tipos de resolución que no implican la

variante estándar, sino la estrategia de mayor uso: la diptongación. Es decir, el

antagonismo no se da entre la variante estándar y una no estándar, sino entre dos

variantes que se alejan de la norma.

Para estos hablantes, la diptongación como resolución de hiatos se ha vuelto la estrategia

de mayor uso, pero ha surgido un cambio que bifurca tal variante y la estratifica

socialmente. Es decir, en el fenómeno de resolución de hiatos sobresalen dos variantes no

estándares que parecen antagónicas y que están condicionadas en gran medida por

factores sociales. Por una parte, la formación de diptongo con deslizada media, es

favorecida por los hablantes de nivel educativo, jóvenes y hombres; por otra parte, los

diptongos con deslizada alta son favorecidos por los niveles educativos inferiores, las

personas mayores y mujeres.

Dado que la formación de diptongos con deslizada alta ha sido documentada como una

estrategia de resolución de hiatos desde hace mucho tiempo, y ha sido recientemente que

se ha señalado la posible diptongación con deslizadas medias, en este estudio concluimos,

164
considerando también la comunidad de habla y su conformación demográfica,

socioeconómica y cultural, que estamos ante un cambio en curso teniendo como variante

innovadora la formación de diptongos con deslizada media.

Sugerimos en este estudio que la diptongación con deslizada alta surgió como una

respuesta antihiática, la cual parece haber ser sido liderada por mujeres y por los grupos

educativos inferiores. Aunque esta estrategia mostró aceptación y avanzó hasta los

niveles educativos superiores, su prominencia como forma no estándar se hizo evidente

en la comunidad probablemente por los grupos cultos y su estigma empezó a expandirse

asociando esta variante con formas “coloquiales”, “vulgares”, o “rurales”, como se le ha

descrito en la literatura. Como reacción a esta variante estigmatizada, surge otra forma de

resolución de hiato que parece ser un punto intermedio entre la variante estándar y la

variante no estándar estigmatizada: la formación de diptongos con deslizada media.

Esta nueva variante es liderada por el nivel educativo superior, por hombres y jóvenes.

Tiene la ventaja de guardar más similitudes con la variante estándar, pues se mantiene la

calidad de la vocal, aunque su articulación varíe en cuanto a constricción o duración. Es

decir, parece ser que los hablantes distinguen perceptualmente entre una deslizada alta y

una media, y al mantener la media, se piense que se está más cerca de la forma estándar.

Esta resolución con la deslizada media guarda también semejanzas con la forma escrita y

parece no alterar las normas del registro oral o escrito. Por el contrario, con la

diptongación con deslizada alta, los hablantes cultos probablemente relacionan esta

estrategia con la alteración de la calidad vocálica, lo cual se refleja en la escritura al usar

165
el grafema <i> en las formas de los verbos –ear en vez de una <e> : patié, voltió,

coquetiar, etc.

Aunque a primera vista pareciera una variable estable que muestra simplemente

estratificación social, la diferencia entre los grupos etarios conlleva a interpretar el caso

como un cambio en marcha fuertemente avanzando por los jóvenes, grupo en el que la

diferencia entre sexos es inexistente. Apoyamos esta conclusión también en el análisis de

la comunidad de habla, la influencia de otros dialectos, y la posible difusión de esta

variante en un nivel macro. Vuskovich (2006) registró el uso de esta estrategia en el nivel

postléxico en la ciudad de México como la de mayor uso en la supresión de hiatos y

también encontró que los hombres favorecen esta estrategia. Proponemos así que estamos

ante un cambio en curso donde tenemos una variante local (diptongos con deslizada alta)

que covaría, con miras a ser reemplazada, con una variante global (diptongos con

deslizada media).

Esta disertación, por tanto, contribuye a la literatura variacionista al ofrecer una

descripción del fenómeno e intentar dilucidar las pautas de la variación y cambios

lingüísticos en el habla de esta comunidad de habla en particular. Sin un estudio de este

tipo, poco se puede saber sobre el tipo de variación al que nos enfrentamos con el

fenómeno de la resolución de hiatos. Por otra parte, este estudio también ofrece algunas

formas para la identificación de hiatos y diptongos, así como para la distinción entre

diptongos con deslizada alta o media.

166
5. 2 Futuros estudios

Dado que también se identificaron y jerarquizaron factores estructurales que afectan la

selección de determinada estrategia, las implicaciones de estos resultados en la fonética y

la fonología pueden ser varias. Sería conveniente definir la existencia de la deslizada

media anterior en otros contextos fonéticos en español y extender esta investigación con

la /o/, pues puede ser que también ocurran diptongos con la deslizada media posterior y

que no todos sean con /w/. Podrían también realizarse estudios de percepción de

diptongos con medias y con altas para investigar si los hablantes distinguen

auditivamente estos sonidos. De probarse cierto, significaría integrar las deslizadas

medias en el inventario de sonidos del español.

Por otra parte, el acento en la V1 resultó ser el factor principal que favorece el

mantenimiento de los hiatos. Coincidentemente, también se encontró que la traslación

acentual, por lo menos en este tipo de verbos, es casi inexistente. Este hecho es diferente

de lo que sucede en dialectos como el chicano y el peninsular en los que la dislocación

del acento es más permisible. Al respecto surgen varias preguntas que deberían atenderse,

por ejemplo, por qué existen estas diferencias, qué condiciona esta variación, y qué

efectos tiene en la lengua esta posibilidad de traslación acentual.

Entre los factores estructurales, la calidad de la vocal siguiente también fue significativa

junto con el tipo de sílaba. Por tanto, análisis de la estructura silábica en español y su

relación con el acento, el grado de sonoridad y la co-articulación podrían ser útiles para

entender las preferencias antihiáticas de algunas lenguas o dialectos. Las intuiciones de

167
los hablantes sobre la silabificación de palabras con secuencias vocálicas pueden ser una

fuente interesante de investigación. A través de un estudio dialectal comparativo se

podría pedir a dos o tres grupos de hablantes que silabificaran por escrito un número de

palabras con vocales adyacentes en hiato (prescrito como hiato por la norma estándar) y

posteriormente que leyeran estas palabras insertándolas en una frase con el mismo

contexto fonético para facilitar el análisis acústico y evitar efectos de los sonidos

adyacentes. De esta manera se podrían contrastar sus intuiciones con su producción y

saber un poco más sobre la construcción silábica en los hablantes.

El análisis acústico fue fundamental para este estudio pues a través de diferentes factores

como la duración, la pendiente total y parcial y su velocidad, la forma de la trayectoria

formántica, la tasa de crecimiento/decremento, y los valores de F1 y F2, se pudieron

identificar las estrategias y distinguir principalmente entre un diptongo y un hiato, y una

deslizada media y una alta, lo cual a veces no es muy fácil distinguir de manera

impresionista. Este trabajo en realidad fue arduo y complicado porque el análisis fue

individual por ítem y es muy difícil controlar el efecto de velocidad del habla de los

informantes. No obstante, considerando todos los parámetros antes mencionados, se pudo

determinar con bastante precisión la estrategia usada. En futuros estudios sería

conveniente considerar otros y diferentes contextos fonéticos de secuencias vocálicas y

establecer parámetros o correlatos precisos y generales, tratando de controlar las variables

de velocidad, efectos de co-articulación, duración intrínseca de las vocales implicada y el

acento, entre otros.

168
Con respecto a los instrumentos usados, aunque la entrevista sólo arrojó un centenar de

ítems, ésta tuvo una función muy importante en este estudio pues nos permitió escuchar

secuencias vocálicas en un contexto comunicativo más natural y espontáneo. En general,

se logró una buena interacción con los informantes y muchos de ellos se mostraron

cómodos y relajados al hablar. Además, fue útil para conocer más la comunidad, sus

costumbres y tradiciones, sus actitudes hacia los cambios en la ciudad, su visión de los

inmigrantes, los roles femenino y masculino, entre otros temas. De hecho, fueron las

entrevistas las que contribuyeron en gran medida a la interpretación de la variación del

fenómeno observado. Se obtuvo información de carácter cualitativo, que fue valiosa para

interpretar la variación en esta comunidad de habla.

Por otra parte, la prueba de sombreado y reconstrucción fonética arrojó muchos datos en

los que pudimos controlar el contexto fonético y facilitar el análisis acústico. Esta prueba

se usa generalmente en cursos de entrenamiento de intérpretes, pero en estudios donde la

lectura de palabras o textos puede influir en la pronunciación de la variable observada,

ésta puede ser una técnica muy útil. En nuestro caso, tratamos de evitar lo más posible

que los informantes vieran los verbos –ear por escrito porque esto podría concientizarlos

de la vocal implicada en la primera posición y suprimir realizaciones con deslizada alta.

Muchas personas con niveles bajos de educación pueden pensar que se trata de verbos –

iar y no –ear, pero si ven las palabras escritas, esto puede motivar formas diferentes. En

este estudio modificamos un poco la actividad agregando dibujos que facilitaban la

comprensión del contexto y la oración. De esta manera, con esta prueba, los informantes

escuchaban a una hablante de la comunidad con su mismo dialecto decir estas frases en
169
un tono natural y ellos sólo repetían. Dado que el ruido blanco cubría la secuencia

vocálica, los hablantes tenían que reconstruir el verbo apoyándose del contexto y de los

dibujos que se hicieron para acompañar la actividad.

Esta técnica de sombreado y reconstrucción fonética puede ser muy útil en estudios de

variación. Es importante integrar suficientes y variados distractores, así como por lo

menos dos frases para la práctica. Esto evita que los informantes se concienticen sobre la

variable en cuestión y monitoreen su habla. También se deben controlar los posibles

efectos que pueda tener el escuchar previamente y después repetir porque puede ser que

se imite la entonación, la velocidad, y obviamente la realización de la variable fonética

estudiada.

La prueba de transformación implicó necesariamente ver por escrito los verbos en

infinitivo, y por eso se dio al final. Con esta prueba los informantes se sintieron

evaluados en el uso de las formas verbales. Sobre todo las personas mayores y de niveles

educativos bajos, mostraban inseguridad y sentían la necesidad de confirmación por parte

de la entrevistadora. Con ellos, las frases de práctica fueron necesarias; con el resto, un

ejercicio era suficiente. Es una buena técnica que genera muchos ítems rápidamente. Sin

embargo, debe controlarse muy bien el contexto, tanto fonético como semántico, donde

estará el verbo, ya que de no hacerlo, los informantes pueden producir formas verbales no

deseadas, pero sí posibles en esos contextos. Por ejemplo, en este estudio ocurrió en

algunos casos que con el adverbio “mañana”, los informantes producían el futuro

perifrástico o analítico en vez del sintético, que es el que se pretendía motivar.

170
Las pruebas usadas en este estudio son rápidas, prácticas, fáciles de entender y hacer y

aunque principalmente con la prueba de transformación se sienten evaluados, piensan que

es la morfología verbal el punto de interés y eso funciona de distractor. A pesar de que

estas pruebas requieren de mucho trabajo por parte del investigador, valen la pena porque

redundan en muchas observaciones o tokens.

Para futuras investigaciones sobre resolución de hiatos, se podría usar un enfoque

fonológico basado en el uso o la frecuencia de uso, pero que integrara también variables

sociales, pues como se encontró en este estudio, este es un fenómeno condicionado tanto

lingüística como socialmente; es decir, es un fenómeno con una variación que presenta

patrones de orden estructural y social muy claros. Este estudio podría limitarse a los

verbos -ear o podría ampliarse a otra clase de palabras: sustantivos y adjetivos e incluir

secuencias vocálicas diferentes.

El fenómeno de la resolución de hiatos y su variación se evidencia incluso en la escritura.

Es común encontrar páginas en internet o en “chats” ejemplos de diptongación con

deslizada alta o de elisión. Y también es frecuente que los niños y adolescentes muestren

dudas o incertidumbre sobre cómo conjugar y escribir estos verbos. En novelas o cuentos

que tratan de reflejar la lengua vernácula de los personajes también se nota esta variante

de resolución. Por tanto, un estudio sobre los efectos de este fenómeno en la escritura

sería muy interesante y revelador, pues indicaría el grado de conciencia de los hablantes y

los cambios que se plasman en la lengua escrita. Podría conducirse un estudio con

informantes de diferentes edades y niveles de escolaridad. Se les puede dar unos dibujos

171
que ellos deben producir por escrito una frase con verbos –ear atendiendo el contexto que

observan en el dibujo. Una siguiente actividad puede ser darles una lista de frases, pero

en lugar del verbo tenemos también un dibujo o podemos incluir las primeras letras del

verbo como pista. Ellos deberán rellenar el hueco con el verbo adecuado. Con este

ejercicio podemos generar verbos en diferentes tiempos, personas, diferentes vocales,

tipo de sílabas y acento en distintas posiciones. Finalmente, podríamos pedirles que

leyeran estas últimas frases y se grabaría su producción oral para contrastarla con la

escrita.

Obviamente estudios de resolución de hiatos en el nivel léxico y con una metodología

variacionista en otros dialectos del español serían muy valiosos para lograr un panorama

completo del fenómeno en el sistema. A través de las divergencias o convergencias que

resulten, se podrían hacer predicciones más precisas de la situación del hiato en la lengua

española en relación con otras lenguas romances u otras lenguas en general.

172
Referencias

Aguilar, L. (1994). Los procesos fonológicos y su manifestación fonética en diferentes


situaciones comunicativas: la alternancia vocal/ semiconsonante/ consonante.
Tesis doctoral. Universidad Autónoma de Barcelona.

Aguilar, L. (1999). Hiatus and diphthongs: acoustic cues and speech situation differences.
Speech communication, 28(1), 57-74.

Aguilar, L. (2005). A vueltas con el problema de las semiconsonantes y las semivocales.


Verba, 32, 121-142.

Aguilar, L. (2006). A propósito de la combinacion de vocales. Nueva Revista de


Filología Hispánica , 54(2), 353-381.

Alarcos Llorach, E. (1995). Gramática de la lengua española. Madrid: Espasa Calpe.

Alarcos Llorach, E. (1971). Gramática estructural. Madrid: Gredos.

Alba, M. (2005). Hiatus resolution between words in New Mexican Spanish: A usage-
based account. Ph. D. Dissertation. The University of New Mexico.

Alba, M. (2006). Accounting for variability in the production of Spanish vowel


sequences. En N. Sagarra, & J. Almeida (Ed.), Selected Preceedings of the 9th
Hispanic Linguistics Symposium (pp. 273-285). Somerville, MA: Cascadilla
Proceedings Project.

Álvarez Nazario, M. (1990). El habla campesina del país. San Juan: Universidad de
Puerto Rico. .

173
Anttila, A. (2002). Variation and phonological theory. En J.K. Chambers, P. Trudgill &
N. Schilling-Estes (Eds.), The handbook of language variation and change (pp.
206-243). Oxford: Blackwell.

Avila, R. (1990). La lengua y los hablantes. México: Trillas.

Bailey, G. (2002). Real and apparent time. En J.K. Chambers, P. Trudgill & N. Schilling-
Estes (Eds.), The handbook of language variation and change (pp. 312-332).
Oxford: Blackwell.

Bakovic, E. (2007). Hiatus resolution and incomplete identity. En S. Colina & F.


Martínez-Gil (Eds.), Optimality-theoretic studies in Spanish phonology. (pp. 62-
73). Amsterdam: John Benjamins.

Barrutia, R. & Schwegler, A. (1994). Fonética y fonología españolas: teoría y práctica,


2nd. Ed. New York: John Wiley and Sons, Inc.

Bianco, V. (1996). The role of sonority in the prosody of Cowichan. Master’s Thesis.
University of Victoria.

Blevins, J. (1995). The syllable in phonological theory. En: John A. Goldsmith (Ed.), The
Handbook of Phonological Theory. (pp. 206-44). Oxford: Blackwell Publishers.

Boersma, Paul & Weenink, David (2008). Praat: doing phonetics by computer (Version
5.0.26) [Computer program]. Recuperado 16 de mayo de 2008, de
http://www.praat.org/

Borowsky, T. (1987). “Antigemination in English Phonology.” Linguistic Inquiry 18:


671-678.

Borzone de Manrique, A.M. (1979). Acoustic analysis of the Spanish diphthongs.


Phonetica, 36, 194-206.

Bybee, J. (2001). Phonology and language use. Cambridge: Cambridge University Press.

174
Cabré, T. & Ohannesian, M. (2007) The role of morpheme boundaries in Spanish glide
formation. En I. Gil, et al (Eds.) Cuadernos de Lingüística del I.U.I. Ortega y
Gasset, 14, (pp. 1-14). Madrid: Instituto ortega y Gasset.

Cabre, T. & Prieto, P. (2004). Prosodic and analogical effects in lexical glide formation
in Catalan. Probus, 16 (2), 113-150.

Canfield, Lincoln. (1981). Spanish Pronunciation in the Americas. Chicago: University


of Chicago Press.

Casali, R. F. (1996). Resolving hiatus. Ph.D. Dissertation, University of California, Los


Angeles.

Casali, R. F. (1997). Vowel elision in hiatus contexts: Which vowel goes? Language,
73(3), 493-533.

Catford, J. C. (1977). Fundamental problems in phonetics. Bloomington: Indiana


University Press.

Chambers, J., Trudgill, P. & Schilling-Estes, N. (Eds.). (2002). Handbook of Language


variation and change .MA: Blackwell.

Chambers, J. K. (2003). Sociolinguistic Theory: Linguistic Variation and its Social


Significance. Oxford: Blackwell.

Chambers, J.K. & Trudgill, P. (1998) Dialectology. Cambridge: Cambridge University


Press.

Chitoran, I. (2002a). A perception-production study of Romanian diphthongs and glide-


vowel sequences. Journal of the International Phonetic Association 32(2), 203-
222

Chitoran, I. (2002b). The Phonology and Morphology of Romanian Diphthongization.


Probus 14(2), 205-246.

175
Chitoran, I. (2001). The Phonology of Romanian: A Constraint-Based Approach. Berlin,
New York: Mouton de Gruyter.

Chitoran, I and J. I. Hualde (2007). From hiatus to diphthong: The evolution of vowel
sequences in Romance. Phonology 24(1), 37-75.

Chomsky, N.& Halle, M. (1968). The sound pattern of English. New York: Harper and
Row.

Clark, J,. Yallop, C. & Fletcher, J. (2007). An introduction to phonetics and phonology.
Malden, MA: Blackwell.

Clements, G. (1990). The role of the sonority cycle in core syllabification. En: John
Kingston and Mary E. Beckman (Eds.), Papers in laboratory phonology
1:between the grammar and physics of speech, (pp.283-333). Cambridge:
Cambridge University Press.

Clements, G. (2005). Does sonority have a phonetic basis? Comments on the chapter by
Vaux. En E. Raimy & C. Cairns, (Eds.), Contemporary Views on Architecture and
Representations in Phonological Theory. Cambridge, MA: MIT Press.

Clements, G, & Keyser, S. (1983). CV phonology: a generative theory of the syllable.


Cambridge, MA: MIT Press.

Coello Vila, C. (1996). Bolivia. En M. Alvar (Ed.). Manual de Dialectología Hispánica.


El español de América. (pp. 169-183). Barcelona: Ariel Lingüística.

Contreras, H. (1969). Vowel fusion in Spanish. Hispania, 52, 60-62.

Coren, A. & Warren, W. (2003). The importance of duration in the perception of glides
and vowels. Journal of Acoustical Society of America, 114(4), 2423-

Coren, A. & Warren, W. (2004). Duration as a cue in the distinction between glides and
vowels. Journal of Acoustical Society of America, 115(5), 2608-

Cressey, William. 1978. Spanish Phonology and Morphology: A Generative View.


Washington, D. C.: Georgetown UP.
176
Crystal, D. (1991). A dictionary of linguistics and phonetics. 3rd edition. Cambridge,
MA: Basil Blackwell.

Davies, Mark. (2002) Corpus del español (100 millones de palabras, siglo XIII - siglo
XX). Disponible en http://www.corpusdelespanol.org.

Cury-Lambraño, J. E. (2004). Costeñol versus español. Biblioteca Luis Ángel Arango:


http://www.lablaa.org/blaavirtual/modosycostumbres/cost/indi.htm

De Lacy, P. (1997). Prosodic categorisation. Master’s thesis. University of Auckland.


Rutgers Optimality Archive no. 236- 1297.

De Lacy, P. (2002). The formal expression of scales. Ph. D. Dissertation. University of


Massachusetts Amherst.

Deligiorgis, I. (1992). Maximality and glides. En M. Ziolkowski, M. Noske y K. Deatin


(Eds.) Papers from the 26th Regional Meeting of the Chicago Linguistic Society.
The parasession on the syllable in phonetics and phonology- 1990, 2, (pp. 81-95).
Chicago: Chicago Linguistic Society.

Deligiorgis, I. (1988). Glides and syllables. Ph. D. Dissertation. University of Iowa.

Diccionario Panhispánico de Dudas. (2006). Real Academia Española. Madrid:


Santillana.

D’Introno, F., Del Teso, E. & Weston, R. (1995). Fonética y fonología actual del
español. Madrid: Cátedra.

Eckert, P.(1997). Age as a sociolinguistic variable. En F. Coulmas (Ed.), Handbook of


Sociolinguistics, (pp. 151-67). Oxford: Basil Blackwell.

Eckert, Penelope (2000). Linguistic Variation as Social Practice: The Linguistic


Construction of Identity in Belten High. Oxford: Blackwell.

Eckert, Penelope (2005). Variation, convention, and social meaning. Paper Presented at
the Annual Meeting of the Linguistic Society of America. Oakland, CA.
177
Enciclopedia de los municipios de México. Quintana Roo. (1999) Centro Nacional de
Desarrollo Municipal, Gobierno del Estado de Quintana Roo. Recuperado el 15
de febrero de 2008
http://dzibanche.biblos.uqroo.mx/enc_munic_mex/quintanaroo/23000d.htm

Face, T. & Alvord, S. (2004). Lexical and acoustic factors in perceptions of the Spanish
diphthongs vs. hiatus contrast. Hispania, 87(3), 553-564.

Farrell, P. (1990). Spanish stress: A cognitive analysis. Hispanic Linguistics, 4 (1), 21-56.

Feagin, Crawford (2002) Entering the community: fieldwork. En J.K. Chambers, P.


Trudgill & N. Schilling-Estes (Eds.), The handbook of language variation and
change (pp. 20-39). Oxford: Blackwell Publishing.

Flórez, L. (1951). La pronunciación del español en Bogotá. Bogotá: Publicaciones del


Instituto Caro y Cuervo.

Frago Gracia, J. A. & Franco Figueroa, M. (2003). El español de América. Cádiz:


Servicio de Publicaciones de la Universidad.

García Fajardo, J. (1984). Fonética del español de Valladolid, Yucatán. México. UNAM.

Garrido, M. (2007). Diphthongization of Mid/Low Vowel Sequences in Colombian


Spanish. En J. Holmquist, A. Lorenzino & L. Sayahi (Eds.), Selected Proceedings
of the Third Workshop on Spanish Sociolinguistics. (pp.30-37). Somerville, MA:
Cascadilla Proceedings Project.

Grammont, M. (1933). Traité de Phonetiqué. Paris. Libraire Delagrave.

Harris, J.W. (1983). Syllable structure and stress in Spanish: a nonlinear analysis.
Cambridge, MA: MIT Press.

Hammond, R. (2001). The Sounds of Spanish: Analysis and Application. MA: Cascadilla
Press.

178
Henríquez Ureña, P. (1938). El español en Méjico, los Estados Unidos y la América
Central. Buenos Aires: Universidad de Buenos Aires.

Henríquez Ureña, P. (1976). Observaciones sobre el español en América y otros estudios


fonológicos. Serie Estudios lingüísticos y filológicos, 1, Buenos Aires: Academia
Argentina de Letras.

Hogg, R., & McCully, C. (1987). Metrical phonology. A coursebook. New York, New
York, USA: Cambridge University Press.

Hooper, J.B. (1976). An Introduction to Natural Generative Phonology. New York:


Academic Press.

Hualde, I. (1991). On Spanish syllabification. En H. Campos, & F. Martínez-Gil (Eds.),


Current Studies in Spanish Linguistics (pp. 475-493). Washington: Georgetown
University Press.

Hualde, I. (1994) La contracción silábica en español. En V. Demonte (Ed.) Gramática del


español (pp.629-647). México, D.F.: El Colegio de México.

Hualde, I., Olarrea, A., Escobar, A. M. (2001). Introducción a la lingüística Hispánica.


España: Cambridge University Press.

Hualde, I. & Prieto, M. (2002). On the diphthong/hiatus contrast in Spanish: some


experimental results. Linguistics, 40 (2), 217-234.

Hualde, I. (2005). The sounds of Spanish. Cambridge: Cambridge University Press.

Hualde, I., Simonet, M., & Torreira, F. (2008), Postlexical contraction of nonhigh vowels
in Spanish. Lingua, 118, 1906–1925.

Hutchinson, S. & Pinkerton. (1974). Spanish vowel sandhi. En A. Bruck, R. Fox & M.
W. La Galy (Eds.), Papers from the parasession on natural phonology, 184–192.
Chicago: Chicago Linguistic Society.

Hyman, L.M. (2003). A theory of phonological weight. CSLI.


179
Jakobson, R., Fant, G., y Halle, M. (1952). Preliminaries to speech analysis: the
distinctive features and their correlates. Cambridge: MIT.

Jany, C., Gordon, M., Nash, C., Takara, N. (2007). How universal is the sonority
hierarchy? A cross-linguistic study. En 16th International Congress of Phonetic
Sciences, 16, 1401–1404.

Jenkins, D. (1999). Hiatus resolution in Spanish: Phonetic aspects and phonological


implications from northern New Mexican data. Ph.D. Dissertation, The University
of New Mexico.

Jespersen, O. (1904). Lehrbuch der Phonetik. Leipzig and Berlin.

Johnstone, B. (2000). Qualitative methods in sociolingustics. New York: Oxford


University Press

Jones, D. (1918). An outline of English phonetics. (Reprinted 1956 (8th edition) New
York: E.P. Dutton and Co., Inc.

Kabak, B. (2007). Hiatus resolution in Turkish: an underspecification account. Lingua,


117(8), 1378-1411.

Kenstowickz, M. (1994). Phonology in generative grammar. Malden, MA: Blackwell.

Kirchner, R. M. (1998). An effort-based approach to consonant lenition. Ph.D.


Dissertation, UCLA.

Kirchner, R. M. (2001). Phonological contrast and articulatory effort. En L. Lombardi


(Ed.), Segmental phonology in Optimality Theory, (pp.79-117). Cambridge:
Cambridge University Press.

Kirchner, R. M. (2004). Consonant lenition. En Hayes, Kirchner & Steriade (Eds.),


Phonetically-based phonology, (pp.313-345). Cambridge: Cambridge University
Press.

180
Kiparsky, P. (1979). Metrical Structure Assignment is Cyclic. Linguistic Inquiry 10, 421-
441.

Labov, W. (1966). The social stratification of English in New York City. Washington,
D.C.: Center for Applied Linguistics.

Labov, W. (1972a). Hypercorrection by the lower middle class as a factor in linguistic


change. En Sociolinguistic Patterns. W. Labov (Ed.), (pp.122-42). Philadelphia:
University of Pennsylvania Press.

Labov, W. (1972b). Sociolinguistic Patterns. Philadelphia: University of Pennsylvania


Press.

Labov, W. (1994). Principles of Linguistic Change, Volume I: Internal factors. Oxford:


Blackwell.

Labov, W. 2001. Principles of Linguistic Change. Volume II: Social factors. Oxford and
Cambridge, MA: Blackwell.

Labov, W. et al. (2006). Listener’s sensitivity to the frequency of sociolinguistic


variables. Working papers in Linguistics 12(2), 105-129.

Ladefoged, P. (2001). A course in phonetics (4th Edition ed.). Boston, MA: Heinle &
Heinle.

Ladefoged, P. (2003). Phonetic data analysis. An introduction to fieldwork and


instrumental techniques. Oxford: Blackwell.

Levi, S. V. (2004). The representation of underlying glides: A cross-linguistic study. Ph.


D. Dissertation. University of Washington.

Levi, S.V. (2007). Phonemic vs. derived glides. Lingua. 1-23.

Levin, J.(1985). A metrical theory of syllabicity. Ph. D. Dissertation. MIT.

181
Lipski, J. M. (2006). El español de América. Madrid: Cátedra Lingüística.

Llisterri, J., Machuca, M., Mota, C. d. l., Riera, M., & Ríos, A. (2004). La percepción del
acento léxico en español. Recuperado el 2 de octubre de 2009, de
http://liceu.uab.es/~carme/Homenaje_Quilis04.pdf

Lope Blanch, J. M. (1996). México. En M. Álvar (Ed.), Manual de Dialectología


Hispánica, (pp. 81-87). Barcelona: Ariel.

Lope Blanch, J. M. (1983). Estudios sobre el español de México. México: Universidad


Nacional Autónoma de México.

Lope Blanch, J. M. (Ed.). (1972). Estudios sobre el español de México. Centro de


Lingüística Hispánica 2; México. UNAM.

Lope Blanch, J. M. (Dir.) (1990). Atlas Lingüístico de México. México, D.F.: El Colegio
de México. Centro de Estudios Lingüísticos y Literarios.

Maddieson, I., Emmorey, K. (1985). Relationship between semivowels and vowels:


cross-linguistic investigations of acoustic difference and coarticulation.
Phonetica, 42, 163-174.

Martinez-Celdrán, E. (1984). Fonética. Barcelona: Editorial Teide.

Martínez Celdrán, E. (1998). Análisis espectrográficos de los sonidos del habla. Madrid:
Ariel.

Martínez Celdrán, E. & Fernandez, A. (2007). Manual de fonética española. Barcelona:


Ariel.

Martínez-Gil, F. (2000). La estructura prosódica y la especificación vocálica en español:


el problema de la sinalefa en ciertas variedades de la lengua coloquial
contemporánea. En J. Gil Fernández, (Ed.), Panorama de la fonología española
actual. (pp. 511–560). Madrid: Arco Libros, S.L.

182
Matluck, J. (1951). La pronunciación en el español del Valle de México. México, D.F.:
Universidad Nacional Autónoma de México.

McCarthy, J. (1986). OCP Effects: Gemination and antigemination. Linguistic Inquiry,


17, 207-263.

Matluck, J. (1995). Hiato, sinéresis, y sinalefa: a sociolinguistic updating. En P.


Hashemipour, R. Maldonado, M.Van Naerssen (Eds.), Studies in language
learning and Spanish linguistics in honor of Tracy D. Terrell. (pp. 280-289). New
York: McGraw-Hill.

Méndez, José A. (1998) Stress and glides in Spanish syllable structure.Ph. D.


Dissertation. City University of New York.

Milroy, L. & Matthew, G. (2003). Sociolinguistics: method and interpretation. Oxford:


Blackwell Publishers.

Monroy Casas, R. (1980). Aspectos fonéticos de las vocales españolas. Madrid: Sociedad
General Española de Librería.

Montero, D. (2007). The perception of the acoustic correlates of stress: A cross-linguistic


study on English, French and Spanish. MA. Thesis. University of Washington.

Montes Giraldo, J.J. (1996).El palenquero, en M. Alvar (ed.). Manual de dialectología


hispánica: el español de América. (pp. 146-151). Barcelona: Ariel.

Morelli, F. (1999). The phonotactics and phonology of obstruent clusters in Optimality


Theory. Ph. D. Dissertation. University of Maryland.

Morén, B. (2001). Distinctiveness, coercion and sonority. A unified theory of weight.


Routledge: New York and London.

Moreno de Alba, J. G. (1994). La pronunciación del español en México. México. D.F: El


Colegio de México. Serie de Estudios de Dialectología Mexicana.

183
Morgan, T. (1984). Consonant-glide-vowel alternations in Spanish: a case study in
syllabic and lexical phonology. Ph. D. Dissertation, The University of Texas at
Austin.

Morris, R. (1998). Stylistic variation in Spanish phonology. Ph. D. Dissertation, The Ohio
State University.

Navarro Tomás, T. (1918): Manual de pronunciación española, Madrid: CSIC.

Navarro Tomás, T. (1966). Estudios de fonología española. Las Américas . New York.

Navarro Tomás, T. (1971). Manual de Pronunciación Española. Madrid: CSIC.

Navarro Tomás, T. (1990). Manual de pronunciación española, 24ª. ed. Madrid: Consejo
Superior de Investigaciones Científicas.

Núñez Cedeño, R. y Morales-Front, A. (1999). Fonología generativa contemporánea de


la lengua española. Washington: Georgetown University Press.

Ohannesian Saboundjian, M. (2004). La asignación del acento. Tesis doctoral.


Universidad Autónoma de Barcelona.

Padgett, J. (2008). Glides, vowels, and features. Lingua, 118(12), 1937-1955.

Paolillo, J. (2002). Analyzing linguistic variation: Statistical models and methods.


Stanford: CSLI.

Parker, S. (2002). Quantifying the Sonority Hierarchy. Ph. D. Dissertation. University of


Massachusetts Amherst.

Penny, R. (2000). Variation and change in Spanish. Cambridge: Cambridge University


Press.

Pérez Aguilar, R. A. (2002) El habla de Chetumal. Fonética, gramática, léxico indígena


y chiclero. Quintana Roo, México: Fondo Estatal para la Cultura y las Artes.
184
Perissinotto, G. (1975). Fonología del español hablado en la Ciudad de México: ensayo
de un método sociolingüístico. Trad. Raúl Ávila. México, D.F.: El Colegio de
México.

Picard, M. (2003). On the emergence and resolution of hiatus. Folia Lingüística


Histórica, 2003, 24( 1-2), 47-57.

Preston, D. R. (2002). Language with an attitude. En J. Chambers, P. Trudgill, & N.


Schilling-Estes (Eds.), Handbook of Language variation and change (pp. 40-66).
MA: Blackwell.

Prieto, M. (2002) Acoustic correlates of the syllable: Evidence from Spanish. Ph. D.
Dissertation. University of Illinois at Urbana-Champaign.

Prince, A. & Smolensky, P. (2004). Optimality Theory: Constraint Interaction in


Generative Grammar. Blackwell Publishers.

Quesada Pacheco, M.A. (1996). El español de América Central. En: M. Alvar (Ed.),
Manual de dialectología hispánica: el español de América. (pp. 101–115).
Barcelona: Ariel.

Quilis, A. (1993) Tratado de fonología y fonética españolas. Madrid. Gredos.

Reynolds, W. (1994). Variation and phonological theory. Ph.D. Dissertation, University


of Pennsylvania.

Rosenthall, S. (1994). Vowel/glide alternation in a theory of constraint interaction. Ph.D.


Dissertation. University of Massachusetts Amherst.

Rubach, J. (2002). Against subsegmental glides. Linguistic Inquiry, 33(4), 672-687.

Sands, K. L. (2004). Patternings of vocalic sequences in the world's languages. Ph. D.


Dissertation. University of California. Santa Barbara.

Sanicky, C. A. (1989). Las vocales en contacto en el habla de Misiones, Argentina.


Hispania , 72 (3), 70-704.
185
Sankoff, D., Tagliamonte, S., Smith, E. (2005). Goldvarb X: A variable rule application
for Macintosh and Windows. Department of Linguistics, University of Toronto.
Recuperado el 25 de junio de 2006
http://individual.utoronto.ca/tagliamonte/Goldvarb/GV_index.htm

Sausurre, F. de (1914). Cours de Linguistique Générale. Lausanne and Paris: Payot.

Schwegler, A. y Kempff, J. (2006). Fonética y fonología españolas. Wiley.

Sedano, M., Bentivoglio, P. (1996). Venezuela. En M. Alvar (Ed.). Manual de


dialectología hispánica: el español de América. (pp. 116–133). Barcelona: Ariel.

Selkirk, E. (1984). On the major class features and syllable theory. En: M. Aranoff and R.
T. Oehrle (Eds.), Language sound structure: studies in phonology presented to
Morris Halle by his teacher and students. (pp. 107-136). Cambridge,
Massachusetts: MIT Press.

Selkirk, E. (1982). The syllable. The structure of phonological representations. En H. van


der Hulst and N. Smith (Eds.), Advances in Nonlinear Phonology (part II).
(pp.337-83). Dordrecht: Fortis.

Senturia, M. (1998). A prosodic theory of hiatus resolution.Ph.D. Dissertation, University


of California, San Diego.

Shepherd. M.A. (2003). Constraint interactions in Spanish phonotactics: An optimality


theory analysis of syllable-level phenomena in the Spanish language. MA. Thesis.
California State University, Northridge.

Sievers, E. (1881). Grundzüge der Phonetik. Leipzig: Breitkopf and Hartel.

Silva-Covalán, C. (2001). Sociolinguística y pragmatica del español. Washington, D.C.:


Georgetown University Press.

Solé Sabater, M.J. (1985). Experimentos sobre la percepción del acento. Estudios de
Fonética Experimental, 1, 131-242.

186
Steriade, D. (1982). Greek prosodies and the nature of syllabification. Ph. D.
Dissertation. MIT.

Straka, G. (1964). A propos de la question des semi-voyelles. Zeitschrift fuer Phonetik


Sprachwissenschaft und Kommunikationsforschung, 17, 301-23.

Suárez Molina, V (1996). El español que se habla en Yucatán. Apuntamientos


filológicos. México: Edic. UADY.

Sweet, H. (1890) A primer of phonetics. (3rd edition 1906). Oxford: The Clarendon
Press).

Tagliamonte, S. (2006). Analysing sociolnguistic vaiation. Cambridge: Cambridge


University Press.

Trudgill, P. (1974). Linguistic change and diffusion: Description and explanation in


sociolinguistic dialect geography. Language in Society, 2, 215–246.

Trudgill, P. (2000). Sociolinguistics: an introduction to language in society. London.


Penguin.

van der Veer, B. (2006). The italian 'mobile diphthongs'. A test case for experimental
phonetics and phonology theory. Utrich, The Netherlands: LOT.

Vaquero, M. (1996). Antillas. En M. Álvar (Ed.). Manual de Dialectología Hispánica


(pp. 51-66). Barcelona: Ariel.

Vuskovich, M. (2006). A sociolinguistic perspective toward hiatus resolution in Mexico


City Spanish. MA Thesis. Louisiana State University.

Weinreich, U., Labov, W. & Herzog, M. (1968). Empirical foundations for a theory of
language change. En W. P. Lehmann & Y. Malkeil (Eds.). Directions for
historical linguistics: A symposium, (pp. 95-188). Austin: University of Texas
Press.

187
Williamson, R. (1986) El habla de Tabasco. Estudio Lingüístico. México. El Colegio de
México.

Yip, M. (1988). The Obligatory Contour Principle and phonological rules: A loss of
identity. Linguistic Inquiry, 19, 65-100.

188
Apéndice A: Protocolo de entrevista

A. Información demográfica

1. ¿Dónde nació? ¿Creció ahí o se fue con sus padres a otro pueblo/ciudad?
2. ¿Cuándo nació?
3. ¿Habla otra lengua además de español? ¿Cuál? ¿Qué lengua usan en casa?
¿Dónde aprendió español? ¿Cuándo? ¿Dónde y cuándo aprendió la otra lengua?
4. ¿En qué lugares ha vivido? ¿Dónde fue a la escuela?
5. ¿Es casado(a)? ¿Tiene hijos? ¿De dónde es su esposo(a)? ¿Es español su primera
lengua? ¿Cómo se conocieron?

B. Rutina y actividades diarias

¿Qué hace todos los días?

C. Niñez

1. Entre la edad de 10 a 15 años, ¿acostumbraba usted jugar con algún grupo de


niños de la colonia o del barrio? ¿Cómo eran? ¿Qué hacían juntos? ¿Cuál era su
juego/actividad favorito? ¿Cuál fue el problema más grande en el que se metió
cuando era niño?
2. ¿Qué hay ahora con los niños en este pueblo o ciudad?
3. ¿Qué presiones o problemas usted enfrentó de niño? ¿Cómo se comparan con los
problemas de los niños de hoy?

C1. Trabajo

1. ¿Cuál fue su primer trabajo?


2. ¿A qué se dedica actualmente?
3. ¿Qué hacen sus hijos?
4. ¿A qué se dedica la gente de la colonia o barrio? ¿Y en el pueblo o ciudad en
general?
189
C2. Escuela

1. ¿Dónde estudia? ¿Qué estudia?


2. ¿Por qué escogió esa carrera? ¿Qué va a hacer cuando termine de estudiar?
3. ¿Qué le gusta o disgusta de su escuela?
4. ¿Alguna experiencia divertida o diferente en la escuela?
5. ¿Qué hizo ayer después de la escuela? ¿Y hoy que hará?

D. Acerca del barrio o colonia/ pueblo o ciudad

1. ¿Se organizan algunas actividades aquí en la colonia, entre los vecinos? Fiestas
patronales, posadas, etc.
2. ¿Qué problemas tienen aquí en la colonia?
3. ¿Hay mucha gente que viene de otros estados o ciudades a vivir aquí? ¿Qué
piensa sobre esto?
4. ¿Qué piensa de la Plaza de las Américas? ¿Cómo ha afectado a Chetumal?
5. ¿Tiene amigos beliceños? ¿Por qué no? ¿Qué piensa de ellos?

E. Peligro de muerte

1. ¿Ha estado en una situación de peligro de muerte? ¿En una situación muy difícil?

F. Sueños

1. ¿Cuáles son sus sueños? ¿Qué es lo que usted sueña en la vida?

190
Apéndice B: Técnica de sombreado y reconstrucción fonética

Enunciados objetivo:

Presente

Yo bombeo de vez en cuando la tubería.

No es necesario que tú zarandees tanto al niño.

Tú chambeas tanto como yo.

Gloria capea poco a poco.

Estás buscando que te cacheteemos

Ana y yo cacheteamos a la vecina.

Mis amigos se besuquean donde sea.

Pretérito

Juan volteó todas las tortillas.

Ayer bombardearon la ciudad.

¿Dónde te golpeaste?

¡…pero yo la pateé con fuerza!

Futuro

Creo que chapearé la próxima semana.


191
Los manifestantes bloquearán la calle.

Todos plantearemos el problema.

Enunciados distractores:

Miguel corre en la bahía todos los días.

Nosotros comemos salbutes los fines de semana.

El bebé quería leche.

Yo no dije eso.

Harás lo que el médico te diga.

Enunciados de práctica:

Toño vino a verte.

Paty y yo haremos relleno negro.

192
Apéndice C: Prueba de transformación

Enunciados objetivo:

Presente

Yo siempre parrandear por el boulevard.

No quiero que tú chiquear tanto al niño.

Todos los sábados los niños chapotear en la alberca.

Nosotros nunca chatear por las mañanas.

Algunas veces tú me terapear muy bien.

¿Quieres que patear (yo) la pelota?

Pretérito

Ayer el niño golpearse con la pelota

La semana pasada las vecinas arguendear todo el tiempo

Anoche Ángel trapear con una camisa

Ayer yo coquetear con mi vecino/a.

Anoche tú golpear la puerta.

Futuro

Mañana yo estropear tus planes.


193
Mañana nosotros redondear el negocio.

El próximo domingo los chicos batear con todas las ganas.

Mañana por la mañana tú ondear la bandera

Enunciados distractores

Todos los lunes mi hermano cocinar frijol con puerco.

Ayer mis cuates y yo jugar dominó

Mañana por la mañana tú pagar el recibo de luz.

Algunas veces mis hermano llevar a su novia al cine.

El año pasado nosotros viajar a Cuernavaca.

Enunciados de práctica

Todos los años mi tía me regalar un libro

La próxima semana yo escribir una carta.

194
Apéndice D: Dibujos para la prueba de sombreado y
reconstrucción fonética

195
196
197
198
199
200
201
202
Apéndice E: The Ohio State University Consentimiento para
participar en la investigación

Resolución de hiato en verbos –ear del español


Título del estudio:
mexicano: un estudio sociofonético
Investigador: Terrell A. Morgan

Patrocinador: N/A

Esta es una forma de consentimiento de participación en la investigación, y contiene


información importante sobre este estudio y qué esperar si decide participar.
Su participación es voluntaria.

Revise la información con cuidado y siéntase con la libertad de hacer cualquier pregunta
antes de tomar una decisión sobre su participación o no en este estudio. Si decide
participar, se le pedirá que firme esta forma y le entregaremos una copia de la misma.

Propósito:
Nos interesa recolectar datos del habla de Chetumal e identificar si hay variación o no
con relación a otros dialectos (formas de hablar) en español. Se le está pidiendo su
participación en esta investigación porque como miembro de la comunidad es usted muy
valioso para la variación que pueda observarse. Se espera que cuarenta y ocho personas
participen en este proyecto.

Procedimientos/Actividades

Primero, tendremos una entrevista que incluye preguntas de la vida diaria, de


celebraciones o festividades en la ciudad, y de alguna anécdota que quiera compartir.
Después, tendremos dos actividades. En una de ellas, usted escuchará a una persona
diciendo algo y tendrá que repetir lo que escuchó. Puede escuchar una vez más si es
necesario. La segunda actividad es como un juego. Yo le voy a dar unas tarjetas con unas
203
palabras y usted va decir algo (una frase) con esas palabras. Tanto la entrevista como las
actividades son anónimas y serán audiograbadas. No tiene que darme sus datos
particulares; sólo necesito saber su edad y nivel de escolaridad.

Duración:
La entrevista durará treinta minutes y se espera que complete las actividades en treinta
minutes. Así, su participación en este estudio será de una hora aproximadamente. Usted
puede dejar el estudio en cualquier momento. Si decide dejar de participar en el estudio,
no habrá ninguna penalidad, y usted no perderá ningún beneficio que de otra forma usted
tendría. Su decisión no afectará cualquier futura relación con The Ohio State University.

Riesgos y beneficios:
No hay riesgos para los participantes. Usted no se beneficiará directamente por participar
en este estudio . Sin embargo, obtendremos una descripción de la variación en la lengua y
la compartiremos con los participantes que así lo deseen. Beneficios sociales de mayor
magnitud pueden incluir un mejor conocimiento de la situación lingüística y social de los
participantes, la cual puede ser útil para futuras investigaciones.

Confidencialidad:

Para este estudio no se requiere ni se registrar información personal, excepto sue dad y
nivel de escolaridad. Se harán todos los esfuerzos para mantener su información
relacionada con este estudio confidencial. Todos los registros de su participación no
tendrán forma de ser identificados y solamente el investigador principal y la co-
investigadora tendrán acceso a los datos.

Incentivos:
No recibirá pago alguno por su participación en este estudio.

Derechos de los participantes:

Usted puede rehusarse a participar en este estudio sin penalidad o pérdida de beneficios
que usted tiene de otra forma.
Si escoge participar en este estudio, usted puede terminar su participación en cualquier
momento sin ninguna penalidad o pérdida de beneficios. Al firmar esta forma, usted no
concede ningún derecho legal personal que usted puede tener como participante en este
estudio.

204
Un Equipo de Evaluación Institucional responsable de la investigación de sujetos
humanos en la Universidad Estatal de Ohio examinó este proyecto de investigación y
determinó que es aceptable de acuerdo con las regulaciones estatales y federales
aplicables y las políticas universitarias diseñadas para proteger los derechos y bienestar
de los participantes en la investigación.

Contactos y preguntas:

Si tiene preguntas, dudas o quejas sobre este estudio, puede contactar al Dr. Terrell A.
Morgan al teléfono (614) 292 -9555 o por correo electrónico a morgan.3@osu.edu, o a la
Mtra. Edith Hernández al (983) 83 503 00 Ext. 245 por correo electrónico a
hernandez.147@osu.edu

Si tiene preguntas sobre sus derechos como participante en este estudio o quiere discutir
alguna preocupación o queja con alguien que no es parte del equipo de investigación,
puede contactar a Ms. Sandra Meadows en la Oficina de Prácticas de Investigación
Responsable en Estados Unidos en el teléfono 1-800-678-6251.

Signing the consent form

I have read (or someone has read to me) this form and I am aware that I am being asked

to participate in a research study. I have had the opportunity to ask questions and have

had them answered to my satisfaction. I voluntarily agree to participate in this study.

I am not giving up any legal rights by signing this form. I will be given a copy of this
form.
Signature of subject

Printed name of subject

AM/PM
Date and time

205
Printed name of person authorized to consent for subject Signature of person authorized to consent for subject
(when applicable) (when applicable)

AM/PM
Relationship to the subject Date and time

Investigator/Research Staff

I have explained the research to the participant or his/her representative before requesting
the signature(s) above. There are no blanks in this document. A copy of this form has
been given to the participant or his/her representative.

Edith Hernandez

Printed name of person obtaining consent Signature of person obtaining consent

AM/PM

Date and time

206

You might also like