Osu1262231085 PDF

RESOLUCIÓN DE HIATOS EN VERBOS –EAR: UN ESTUDIO
SOCIOFONÉTICO EN UNA CIUDAD MEXICANA
DISSERTATION
Presented in Partial Fulfillment of the Requirements for the Degree Doctor of Philosophy
in the Graduate School of The Ohio State University
By
Edith Hernández, M.A.
Graduate Program in Spanish and Portuguese
The Ohio State University
2009
Dissertation Committee:
Professor Scott A. Schwenter, Advisor
Professor Terrell A. Morgan
Professor Rebeka Campos-Astorkiza

Copyright by
Edith Hernández
2009
ABSTRACT
This dissertation investigates the linguistic and social constraints that condition variation
in hiatus resolution in –ear verbs in Mexican Spanish. Previous literature on hiatus
resolution suggests a tendency in many languages, including Spanish, to avoid adjacent
heterosyllabic vowels by employing different strategies to resolve hiatus. This array of
possibilities to deal with heterosyllabic vowel sequences could therefore yield a
heterogeneous variation showing both intra-speaker and inter-speaker variation.
Moreover, the distinction between one strategy and another can sometimes be misleading
or imprecise to the untrained ear and the real pool of strategies can extend beyond our
own perception. On social grounds, some resolution strategies in Spanish, like
diphthongization with a high glide, have been associated with people who are rural,
illiterate or from lower social classes.
This dissertation contributes to the literature on hiatus resolution in Spanish by describing
and analyzing six different strategies used at the lexical level, particularly with –ear verbs
in Mexican Spanish. A variationist methodology along with an experimental approach
were used to identify the acoustic cues that distinguish several different strategies for
resolving hiatus, and to discover the significant internal and external factors constraining
variation in hiatus resolution in the vowel sequences derived from –ear verbs.
ii
The acoustic results show that hiatuses are distinct from diphthongs in duration on
average, but that duration is not a very reliable cue because of frequent speech rate
changes even within the same speaker. Other cues considered for the definition of the
strategies are the rate of the transition curve and its increase/decrease rate; F1 and F2
values; wave forms, and auditory impression. On average, the rate of the transition curve
is higher in hiatuses, and the F2 values are higher in diphthongs in their initial stage than
those of hiatuses. F1 values provide an acoustic cue for distinguishing a mid-glide from a
high glide.
Six strategies were identified in the resolution of contiguous vowel sequences in –ear
verbs: hiatus maintenance, diphthong formation with mid glide, diphthong formation with
high glide, elision, hiatus with a high vowel, and coalescence. The results show that
hiatus resolution is a linguistically and socially conditioned phenomenon. Stress was
found to be the main structural constraint followed by the V2 quality and the type of
syllable. Age, education, and sex were the social factors affecting the strategies selected
by the informants.
The most favored hiatus resolution strategies in descending order were diphthong
formation with mid glide, maintenance of hiatus, diphthong formation with high glide,
and elision. While diphthong formation with a high glide is favored by women, the oldest
group, and also people with a low education level, diphthong formation with a mid glide
is led by men, the youngest groups, and people with a university or graduate level of
education. The results and analysis of the speech community suggest the presence of a
change in progress having as its most global innovative variant diphthong formation with
iii
a mid glide, which is distinguished from the local variant, the diphthong with a high
glide. The persistence of different resolution strategies, in contrast to hiatus maintenance,
reconfirms the anti-hiatus tendency of Mexican Spanish.
iv
ACKNOWLEDGMENTS
This thesis would not have been possible without the guidance and support of many
people. I owe my deepest gratitude to my advisor, Scott Schwenter whose
encouragement, guidance and support from the beginning to the end of my studies
enabled me to understand and become fascinated by linguistics. I am grateful for the
questions, comments and suggestions he offered me for my dissertation. His expertise
and insightful comments were a great contribution to this study.
I would like to thank also the committee members. It was in Terrell Morgan’s courses
where my initial ideas about this dissertation arose. I am thankful for his generosity,
patience and disposition to discuss my ideas. I thank Terrell the opportunity to work with
him as his research assistant. Terrell has been an inspiration to continue working on
phonetics and phonology. My gratitude also goes to Rebeka Campos-Astorkiza, for
generously dedicating time and effort to read and enrich this dissertation.
I would also like to thank my friends and most of them fellow graduate students, Assela
Reig, Carolina Castillo, Andy Lewis, Manuel Delicado, Magdalena Mejia, Marissa
Vargas, and Gilberto Velázquez for their friendship, support and encouragement during
my stay at OSU.
v
Quisiera agradecer también a todos los informantes que participaron en esta investigación
por su colaboración y disposición. También a mi familia, gracias en especial a mi
hermana Griselda por su siempre apoyo y ánimo a la distancia. Y finalmente, gracias a
Alfredo, mi compañero de vida, quien de inicio a fin me apoyó en esta aventura en todos
los sentidos y en todas las maneras posibles. Gracias por regalarme ideas, hipótesis, y
ayudarme a entender estadística.
vi
VITA
1995……………….B.A. TEFL, Universidad Veracruzana
2000 ………………M. A. Teaching Spanish as a FL, Universidad de Alcalá de Henares
2006 ………………M.A, Hispanic Linguistics, The Ohio State University
PUBLICATIONS
Hernández Méndez E, (forthcoming). La enseñanza de la pronunciación. In R. Reyes

(Ed.) Creencias, estrategias y pronunciación en la enseñanza- aprendizaje de lenguas.
Hernández Méndez, E. (2008). Perspectivas y experiencia docente en la enseñanza de la

pronunciación. Memorias del XXII Foro de Especialistas Universitarios en Lenguas
Extranjeras. Chiapas, Mexico.
Hernández Méndez, E. & Bye, B. (2003). Los alternantes paralingüísticos en español.

Anuario de la División de Estudios Internacionales y Humanidades. Universidad de
Quintana Roo.
Boxill, I. & Hernandez, E. (2002). How tourism transforms language: the case of Playa
del Carmen, Mexico. Social and Economic Studies, 51(1), 47-60.
FIELDS OF STUDY
Major Field: Spanish and Portuguese
Studies in: Sociolinguistics and Psycholinguistics

vii
TABLE OF CONTENTS
ABSTRACT........................................................................................................................ ii
ACKNOWLEDGMENTS .................................................................................................. v
VITA ................................................................................................................................. vii
TABLE OF CONTENTS................................................................................................. viii
LIST OF TABLES............................................................................................................ xii
LIST OF FIGURES ......................................................................................................... xiv
CAPÍTULO 1: INTRODUCCIÓN ..................................................................................... 1
1.1 Panorama general ...................................................................................................... 7
CAPÍTULO 2: REVISIÓN DE LA LITERATURA Y MARCO TEÓRICO .................. 10
2.1 Resolución de hiato en español ............................................................................... 10
2.2. Variación en la resolución de hiatos en español .................................................... 17
2.2.1 Variación y factores externos ........................................................................... 17
2.2.2 Variación y factores internos ............................................................................ 23
2.3 Factores lingüísticos como condicionantes de la resolución de hiatos ................... 35
viii
2.4 Vocales y deslizadas................................................................................................ 38
2.4.1 Vocales y deslizadas desde un punto de vista fonético .................................... 38
2.4.2 El caso de las deslizadas medias...................................................................... 44
2.4.3 Vocales y deslizadas desde una perspectiva fonológica................................... 55
2.5 Sonoridad y resolución de hiatos ............................................................................ 61
2.6 Acento y resolución de hiato ................................................................................... 70
2.6.1 La función del acento en la resolución de hiato ............................................... 72
CAPÍTULO 3: MÉTODO, VARIABLES E HIPÓTESIS................................................ 76
3.1 Teoría de la variación y metodología variacionista ................................................ 76
3.2 Método experimental............................................................................................... 79
3.3 Definición de variables............................................................................................ 80
3.3.1 Variable lingüística dependiente y sus variantes.............................................. 80
3.3.2 Las variables lingüísticas independientes......................................................... 81
3.3.3 Variables externas independientes.................................................................... 83
3.4 Definición de contextos lingüísticos de la variable: e + V...................................... 91
3.5 Hipótesis................................................................................................................. 92
3.6 Sujetos ..................................................................................................................... 93
3.6.1 Población .......................................................................................................... 93
3.6.2 Muestra ............................................................................................................. 95
ix
3.7 Instrumentos ........................................................................................................... 97
3.7.1 La entrevista sociolingüística ........................................................................... 97
3.7.2 Prueba de sombreado y reconstrucción fonética .............................................. 99
3.7.3 Prueba de transformación ............................................................................... 102
3.8 Procedimientos para el análisis de los datos ......................................................... 103
3.8.1 Análisis acústico ............................................................................................. 104
3.8.2 Análisis estadístico ........................................................................................ 110
CAPÍTULO 4 ANÁLISIS DE LOS RESULTADOS.................................................... 112
4. 2 Análisis de los resultados estadísticos de GoldVarb ............................................ 119
4.2.1 Variante mantenimiento del hiato................................................................... 123
4.2.2. Variante formación de diptongo con deslizada media................................... 127
4.2.3 Variante formación de diptongo con deslizada alta........................................ 134
4.2.4. Variante elisión.............................................................................................. 139
4.2.5 Variantes hiato con vocal alta /i/ y fusión ...................................................... 140
4.3 Discusión de los resultados ................................................................................... 145
CAPITULO 5: CONCLUSIONES Y COMENTARIOS ............................................... 161
5.1 Conclusiones ......................................................................................................... 161
5. 2 Futuros estudios.................................................................................................... 167
REFERENCIAS.............................................................................................................. 173
x
APÉNDICE A: Protocolo de entrevista ......................................................................... 189
APÉNDICE B: Técnica de sombreado y reconstrucción fonética.................................. 191
APÉNDICE C: Prueba de transformación...................................................................... 193
APÉNDICE D: dibujos para la prueba de sombreado y reconstrucción fonética........... 195
APÉNDICE E: The Ohio State University Consentimiento para participar en la
investigación ................................................................................................................... 203
xi
LIST OF TABLES
Tabla 1. Ingresos medios equivalentes del hogar ............................................................. 88
Tabla 2. Nivel educativo y subfactores............................................................................. 89
Tabla 3. Variables internas ............................................................................................... 91
Tabla 4. Variables externas............................................................................................... 91
Tabla 5. Habitantes por grupos etarios ............................................................................. 94
Tabla 6. Distribución de la muestra .................................................................................. 96
Table 7. Duración de hiatos y diptongos en entrevista y prueba de sombreado ............. 112
Tabla 8. Duración de hiatos y diptongos en prueba de transformación.......................... 112
Tabla 9. Valores de F2 en hiato y diptongo .................................................................... 114
Tabla 10. Tasa de crecimiento de la trayectoria de F2 ................................................... 115
Tabla 11. Factores que contribuyen a la selección de la variante /e/ (hiato). ................ 124
Tabla 12. Variables acento y grado de sonoridad con hiato ........................................... 125
Tabla 13. Factores que contribuyen a la selección de la variante /e/ (diptongo con
deslizada con media)....................................................................................................... 127
Tabla 14. Relación acento y grado sonoridad en diptongos con deslizada media .......... 129
Tabla 15. Variables instrumento y nivel educativo con deslizada media ....................... 132
xii
Tabla 16. Factores que contribuyen a la selección de la variante /j/ (diptongo con
deslizada alta).................................................................................................................. 134
Tabla 17. Variables vocal siguiente y tipo de sílaba....................................................... 135
Tabla 18. Variables sexo y nivel educativo con /j/ ......................................................... 137
Tabla 19. Variables sexo y edad con /j/ .......................................................................... 138
Tabla 20. Tabla comparativa de estrategias con factores condionantes ......................... 142
Table 21. Resumen de grupos factoriales significativos por estrategia de resolución.... 145
xiii
LIST OF FIGURES
Figura 1 Continuo diptongo-hiato en lenguas romances .................................................. 33
Figura 2. Espectrogramas de [aia], [ai̯ a], y [aja]............................................................. 41
Figura 3. Secuencia [a ‘i] en hiato en copa hípica........................................................... 42
Figure 4. Secuencia [‘ai] en diptongo en patata iqueña. .................................................. 43
Figura 5. Secuencia [a ´e] en lindes de palabra: hiato en estopa épico. ........................... 47
Figura 6. Secuencia [‘ta ek] en lindes de palabras: diptongo en tacatá ecológico. ........ 48
Figura 7. Secuencia [‘ta ik] en lindes de palabras: diptongo en patata iqueña. .............. 49
Figura 8. Estructura silábica de Selkirk ............................................................................ 56
Figura 9. La sílaba en CV ................................................................................................. 56
Figura 10. Diptongo e hiato en CV ................................................................................... 57
Figura 11. Escala universal de sonoridad ......................................................................... 57
Figura 12. La sílaba en la teoría X .................................................................................... 58
Figura 13. La sílaba en la teoría moraica .......................................................................... 59
Figura 14. Diptongo en rumano ........................................................................................ 60
Figura 15. Secuencia deslizada-vocal en rumano ............................................................. 60
Figura 16. Escala de sonoridad en español ....................................................................... 62
Figura 17. La variable linguística y sus variantes............................................................. 80

xiv
Figura 18. Ubicación de Chetumal ................................................................................... 94
Figura 19 Secuencia /ea/ seguida de nasal alveolar ....................................................... 105
Figure 20 ¨batearán ......................................................................................................... 106
Figura 21. Pendiente completa en hiato y diptongo........................................................ 114
Figura 22. Hiato en“pateo” ............................................................................................. 117
Figura 23. Diptongo con deslizada media en “pateó”..................................................... 117
Figura 24. Diptongo con deslizada alta en “pateó”......................................................... 118
Figura 25. Variable lingüística y sus variantes ............................................................... 121
Figure 26. Distribución de las variantes principales de resolución ................................ 122
Figura 27. Variables edad e instrumento con /e/ por porcentaje..................................... 126
Figure 28. Relación edad e instrumento en diptongo con deslizada media .................... 130
Figura 29. Relación edad y nivel educativo con /e/ en porcentajes ................................ 131
Figura 30. Relación sexo y nivel educativo con /e/ en porcentajes ................................ 132
Figura 31. Relación sexo y nivel educativo con /e/ en porcentajes ................................ 133
Figura 32. Relación edad y nivel educativo con /j/......................................................... 136
Figura 33. Relación acento y nivel educativo con variante /j/ ........................................ 139
xv
Capítulo 1: Introducción
El español es una lengua que en la actualidad se habla en más o menos una veintena de
países por más de 400 millones de hablantes, aproximadamente. Sin embargo, en cada
país y en cada zona dialectal o comunidad de habla se observan peculiaridades, cambios
y variaciones del sistema que ponen de relieve su inherente dinamismo. Esta variación
del sistema puede reflejarse en los diferentes niveles de análisis de la lengua: fonético-
fonológico, morfológico, sintáctico y semántico, y puede basarse en uno o varios
aspectos de cada nivel de análisis. Es, precisamente, el grado de distanciamiento en estos
niveles de análisis, sus aspectos específicos y fenómenos peculiares lo que nos conlleva a
conceptos tales como lengua, dialecto, habla, e idiolecto. Esta variación lingüística
resulta fascinante no sólo para los estudiosos de la lengua española, sino también para
incluso cualquier persona, quien se muestra curiosa o sorprendida al escuchar o participar
en conversaciones entre hispanohablantes de diferentes países o zonas dialectales debido
a las diferencias que observa.
Estos temas de variación y cambio lingüístico han sido de gran interés para la
sociolingüística, la cual a través de una perspectiva variacionista, tiene como objetivo
describir, analizar y explicar la variación y el cambio, sus causas y efectos en relación
con variables internas (lingüísticas) y externas (sociales). En general, y teniendo los
trabajos de Labov (1966, 1972) y Trudgill (1974) de la lengua inglesa, los
1
estudios más abundantes desde esta perspectiva han sido de corte fonético-fonológico,
seguidos de estudios morfosintácticos y demás. Las variables sociales más utilizadas han
sido género, edad y clase social. En español, son innumerables los estudios variacionistas
que han contribuido a entender mejor el sistema y sus cambios. Sin embargo, los temas,
fenómenos, métodos y sujetos son tantos y diferentes que hacen necesaria la
investigación desde diferentes ángulos.
A este respecto, y siendo el nivel fonético-fonológico una fuente inagotable para la
investigación, un fenómeno variable frecuentemente aludido en los libros de fonética y
fonología española y en estudios dialectales es la producción de hiatos. No obstante su
mención constante en estos materiales, su estudio desde una perspectiva variacionista no
ha sido abordado en la misma medida. Por ello, realizar investigación sobre este tema se
vuelve relevante, pues no es suficiente con citar ejemplos de aquí y de allá donde los
hiatos se realizan de manera diferente. Es decir, necesitamos saber si efectivamente el
fenómeno presenta variación y ante qué variación nos enfrentamos.
Antes de presentar el objetivo de esta investigación, conviene aclarar algunas ideas y
conceptos sobre este fenómeno. En primer lugar, entendemos hiato como una secuencia
de vocales heterosilábicas adyacentes; es decir, de vocales que corresponden a sílabas
diferentes, ya sea en el interior de la palabra o en los lindes entre palabras. Ejemplos del
primer caso son rí-o; re-al; i-de-al; pa-se-ar; del segundo tipo, mi- a-m-igo; te-aviso; lo-
he comprado; qué-hubo. Con respecto a este tema, en su libro de pronunciación del
español, Navarro Tomás (1966), por ejemplo, señala que “la pronunciación vulgar”
reduce las vocales heterosilábicas a una sola sílaba. El mismo autor remarca que “[…] En
la América española este uso se halla más o menos desarrollado, aun entre las personas
2
instruídas” (p. 67). Por su parte, Quilis (1993) subraya que en el habla no culta se observa
una serie de fenómenos que afectan las secuencias vocálicas. Quilis enfatiza que en
español hay una “tendencia antihiática” que previene la aparición de hiatos. De lo
anterior, se asume que la realización de hiatos en español está asociada con variables
como habla culta, habla vulgar, personas instruidas o no instruidas, español de América,
español peninsular; lo cual indica que estamos ante un fenómeno condicionado por
variables externas.
Este fenómeno de hiatos, sin embargo, no es privativo de la lengua española; según
Casali (1997), muchas lenguas son intolerantes a los hiatos, como las lenguas africanas
Chichewa, Daga, Okpe y Emi, entre otras. El turco, reporta Kabak (2007), es una lengua
que también usa diferentes recursos cuando hay hiatos implicados. Chitoran y Hualde
(2007), por otra parte, subrayan que el francés es una de las lenguas romances con menor
producción de hiatos. No obstante, a pesar de ser un fenómeno general en muchas
lenguas, las formas de enfrentarse a los hiatos varían según la lengua o el dialecto, y otras
condicionantes lingüísticas y sociales. Recientemente, Jenkins (1999) y Alba (2006)
estudiaron el caso del español de Nuevo México; Vuskovich (2006), el español
mexicano; Garrido (2007), el colombiano; Hualde & Prieto (2002); Face & Alvord
(2004), Aguilar (2006) y Hualde et al (2008), el español peninsular; Martínez-Gil (2000)
y Morris (1998), el español chicano y el peninsular, y sus resultados varían no sólo de un
dialecto a otro, sino dentro de un mismo dialecto. De esta manera, el fenómeno de
producción de hiatos muestra una variación compleja que requiere de su estudio en
diversos dialectos atendiendo variables lingüísticas y sociales diversas, que ayuden a
caracterizar y explicar mejor dicha variación.
3
En español mexicano, en particular, es muy frecuente escuchar ‘teatro’ como [te.a.tɾo] o
[tja.tɾo] y palabras como ‘alcohol’, ‘leer’ y ‘paseé’ se escuchan a menudo con la
secuencia vocálica reducida a un solo segmento, o con ambas vocales en sílabas
diferentes. Un caso característico de vocoides contiguos en este dialecto parece ser la
secuencia de vocal media anterior más otra vocal no alta [e]V, pues ésta es fuente de una
notable variación en el habla. Palabras de diferente categoría gramatical -verbos,
adjetivos, sustantivos, por ejemplo ‘peón’, ‘mear’, ‘león’, ‘teatro’, ‘real’, ‘pateó’,
‘volteé’, ‘golpeado’, entre muchas otras- muestran diversas formas de pronunciación
entre los hablantes. La tendencia general que se observa en muchas palabras con esta
combinación [e]V es evitar el hiato; es decir, se evade que las dos vocales aparezcan
contiguas en sílabas distintas. No obstante, esto no siempre es así; hay palabras como
‘leo’, ‘sea’, ‘video’, ‘empleo’, ‘feo/a’, por ejemplo, cuyos grupos vocálicos parecen no
ser alterados y las vocales se mantienen en su respectiva sílaba.
Para lidiar con los hiatos, entonces, los hablantes se valen de diferentes mecanismos o
estrategias de resolución de hiatos, como Casali (1996) las llama. El conjunto de
estrategias usadas por los hablantes también es variable y puede incluir desde la retención
o mantenimiento del hiato, pasando por la diptongación, o la fusión de vocales, u otra
estrategia hasta la elisión de una vocal1. Por tanto, en algunos dialectos o en algunos
grupos de hablantes, se da una preferencia o una tendencia a favorecer una u otra
estrategia, lo cual conlleva resultados diferentes que propician la variación existente.
1
En el capítulo dos se describirán con detalle dichas estrategias.
4
El fenómeno variable de la resolución de hiatos en español mexicano es tan extenso que
se evidencia incluso en la escritura, donde la ortografía normativa se modifica para
acomodar los cambios de pronunciación que se producen con el uso de determinada
estrategia. Así, es común encontrar en textos en internet, chats, novelas, cuentos, o
cualquier texto escrito que trate de reproducir la lengua oral vernácula, ejemplos de
palabras en los que se observa la resolución de hiatos por medio de diversas estrategias:
‘pelió’ (peleó), ‘maiz’ (maíz), ‘raiz’ (raíz), ‘voltié’ (volteé), ‘mojo’ (moho), ‘alcol’
(alcohol), etc.
El problema que conlleva este fenómeno -se presupone-, es que al disponer de varias
estrategias, los hablantes de un dialecto u otro, de un grupo u otro, o incluso sujetos de
manera individual pueden recurrir a cualquiera de ellas y la variación, por ende, puede
resultar heterogénea y arbitraria. Por tanto, indagar sobre los factores que condicionan
esta variación y descubrir sus posibles pautas se convierte en una necesidad imperiosa
para la comprensión y explicación del fenómeno variable de la resolución de hiatos. De
esta manera, el presente estudio sociofonético tiene como objetivo específico identificar
las estrategias usadas para resolver los hiatos en los verbos –ear en español mexicano y
analizar los factores internos y externos que condicionan dichas estrategias. A partir de
estos resultados, podremos analizar el tipo de variación observada y sus patrones.
Para ello, partimos de la hipótesis de que la variación en la resolución de hiatos no es
arbitraria; más bien parece estar condicionada por diversos factores de diferente orden:
lingüísticos, sociales, dialectales y estilísticos. Entre los factores lingüísticos, en la
literatura se reportan en general: tipo de sílaba, posición de las vocales, el acento, el tipo
de morfemas implicados, el contenido léxico, restricciones sintácticas, la calidad de las
5
vocales, el grado de sonoridad de las vocales y el efecto léxico. Dado que el mismo
objetivo del presente estudio delimita ya algunos factores internos al tratarse de hiatos al
interior de palabras, y específicamente de verbos –ear, los factores internos en los que
nos enfocaremos son: la calidad de la vocal siguiente, el acento, el tipo de sílaba y el
grado de sonoridad de la secuencia. Las hipótesis que se postulan son las siguientes:
1. La formación de diptongo es la resolución de hiato más utilizada en los verbos –
ear en español mexicano.
2. En el caso de vocales idénticas en contacto en los verbos –ear, no ocurre que una
se elida; sino que formará diptongo.
3. El acento es la principal condicionante lingüística que inhibe la formación de
diptongos, ya que las vocales que reciben acento son más resistentes a los
cambios.
4. En español mexicano hay una tendencia a evitar secuencias vocálicas con
sonoridad constante; es decir, se prefiere una secuencia vocálica cuyos elementos
se distingan lo más posible en cuanto a sonoridad.
5. La traslación acentual en español mexicano no es favorecida.
6. Las sílabas cerradas desfavorecen el mantenimiento del hiato.
Con respecto a los factores sociales, se incluirán en este estudio el sexo, la edad y el nivel
de escolaridad con el fin de identificar asociaciones de las estrategias de resolución de
hiatos con uno o varios grupos sociales y entender así el tipo de variación observada. Las
hipótesis que se proponen son:
6
1. Los grupos más jóvenes favorecen la resolución del hiato con estrategias
diferentes a la heterosilabificación.
2. Las personas con nivel educativo alto favorecen la deslizada media [], mientras
que aquéllas con un nivel bajo favorecen la deslizada alta [j].
3. La entrevista favorece la resolución de hiatos con estrategias diferentes al
mantenimiento del mismo.
Con el fin de comprobar o rechazar las hipótesis planteadas, este estudio intenta conjuntar
la teoría y metodología variacionista con un enfoque fonético experimental esperando así
obtener suficientes datos y ofrecer resultados más objetivos y confiables que resulten una
fuente útil para el desarrollo de representaciones fonológicas o estudios teóricos de temas
relacionados con la sílaba, las vocales y deslizadas, el acento, así como para la
descripción más real del fenómeno de resolución de hiatos en estudios dialectales.
1.1 Panorama general
El presente estudio se divide en cinco capítulos. El capítulo dos ofrece una revisión de la
literatura y un marco teórico sobre el fenómeno de la resolución de hiatos. En éste se
discuten los trabajos previos sobre el tema y la problemática en general tratando de
dilucidar los factores internos y externos condicionantes de la resolución de hiatos en
español, así como las características fonéticas de las diferentes estrategias. Se discuten
particularmente las estrategias usadas en español para resolver los hiatos y la variación
que se observa al respecto. Además, con el objeto de comprender mejor el fenómeno en
cuestión, se abordan conceptos, nociones y teorías relacionados con la producción de
hiatos, como son la estructura silábica, la escala de sonoridad y el acento.
7
El tercer capítulo presenta la metodología que se implementó para este estudio. Aquí se
detalla la metodología y teoría variacionista, así como su complementariedad con un
enfoque fonético experimental y se justifica su uso para este estudio. Los sujetos,
población y muestra se describen también junto con los respectivos procedimientos de
selección. A continuación, se especifican los instrumentos y procedimientos para la
recolección y análisis de los datos, los cuales -en consonancia con la metodología
variacionista y el enfoque fonético experimental- incluyen una entrevista sociolingüística
y dos pruebas fonéticas, así como análisis estadísticos y acústicos. Finalmente, el
contexto variable y las hipótesis se definen en este capítulo también.
Los resultados de los análisis acústicos se presentan y discuten en el capítulo cuatro.
Éstos se componen de las observaciones obtenidas en las entrevistas y las pruebas
fonéticas. Estos análisis fueron indispensables para definir la variante utilizada (estrategia
usada) y conformar el corpus que se utilizó en el análisis estadístico. Presentamos aquí
algunos hallazgos de carácter acústico que nos permitieron identificar y clasificar las
estrategias. Por ejemplo, se discute el papel de la duración, la velocidad y pendiente de la
transición, los valores de F1 y F2 y su relevancia. Además, los resultados aquí obtenidos
se analizan en relación con los hallazgos, conceptos y teorías revisados en el capítulo dos.
La segunda parte del capítulo cuatro integra los resultados e interpretación del análisis
estadístico para el cual se incluyen las variables lingüísticas y sociales. Por medio de
tablas y gráficas se ilustra la relación y función de las variables internas y externas en
relación con las estrategias de resolución de hiato en los verbos –ear. Al igual que en la
primera parte del capítulo, los resultados encontrados se analizan e interpretan en
términos de los conceptos y teoría revisados en el capítulo dos y se validan o rechazan las
8
hipótesis aquí postuladas. Al final del capítulo de analiza el tipo de variación de este
fenómeno en la comunidad de habla identificando sus patrones y tendencias.
Finalmente, en el capítulo cinco se presentan las conclusiones a las que se llegaron con
esta investigación y se sugieren direcciones para futuras investigaciones sobre el tema de
resolución de hiato en español.
9
Capítulo 2: Revisión de la literatura y marco teórico
2.1 Resolución de hiato en español
Entendemos como hiato una secuencia de vocales heterosilábicas adyacentes, que puede
encontrarse en los lindes silábicos dentro de una palabra (nivel léxico) o entre dos
palabras (nivel postléxico). Es decir, estas vocales pertenecen a sílabas contiguas y se
pronuncian en sílabas diferentes. De acuerdo con el Diccionario panhispánico de dudas
y otras gramáticas tradicionales, la silabificación de secuencias vocálicas en el nivel
léxico es bastante predecible, ya que se produce un hiato en los siguientes contextos:
Combinaciones de vocal media o baja átona (a,e,o) y vocal alta tónica (i, u):
1) raíz [ra.ís] oír [o.íɾ] ataúd [a.ta.úđ]
Combinaciones de vocal alta tónica (i, u) y vocal media o baja átona (a,e,o):
2) frío [fɾí.o] búho [bú.o] María [ma.ɾí.a]
Combinaciones de vocales idénticas:
3) poseer [po.se.éɾ] alcohol [al.ko.ól] azahar [a.sa.áɾ]
Combinaciones de dos vocales medias o una media con una baja:
4) teatro [te.á.tɾo] poeta [po.é.ta] etéreo [e.té. ɾe.o]
10
Casali (1996) señala que muchas lenguas son intolerantes al hiato, y la lengua española
parece ser una de ellas. Ante la presencia de hiatos, las lenguas se apoyan de diversas
estrategias para resolver (sortear) la secuencia vocálica. Casali llama resolución de hiato
al uso de cualquier estrategia de las que se valen los hablantes para enfrentar los grupos
vocálicos heterosilábicos. Dichas estrategias, de acuerdo con el mismo autor, pueden ser:
heterosilabificación, diptongación, epéntesis consonántica, elisión, formación de
deslizada y fusión. A continuación se describe cada una de ellas con ejemplos en español
en el nivel léxico, siempre que sea posible:
• Heterosilabificación: CV1 + V2 > .CV1. V2
Esta estrategia implica mantener las vocales en sílabas diferentes; es decir, es el
mantenimiento del hiato.
5) teatro [te.á.tɾo] río [rí.o] aún [a.ún]
• Diptongación: CV1 + V2 > . CV1 V2
Las vocales de la secuencia se silabifican en el núcleo de una sola sílaba. Logjenga
(1994), citado en Casali (1996), ilustra esta estrategia en Ngiti, una lengua africana
donde ocurre diptongación:
6)
izo ɔku ‘caña de azúcar’  [.i.zoɔ .ku]
Ngbangba ɔdzɔ ‘enano’  [.ngba.ngbaɔ .dzɔ]
Clark et al. (2007) señalan que cuando en la producción de vocales hay un ligero
movimiento articulatorio que resulta en un cambio en la calidad auditiva, ya sea antes o
después de la vocal objetivo, tenemos una onglide (cuando la deslizada antecede a la
11
vocal) y una offglide (cuando la deslizada procede a la vocal) y usan subíndices o
superíndices, respectivamente, para distinguirlas en la transcripción fonética. Sin
embargo, estos autores distinguen este fenómeno con deslizadas de los diptongos porque
en los primeros hay sólo un valor objetivo de la vocal, mientras que en los segundos hay
dos objetivos vocálicos y su movimiento articulatorio ocupa una parte considerable del
diptongo. En la transcripción usan dos dígrafos en el mismo nivel. En español, éstos son
los diptongos que se observan. En Ngiti, los ejemplos de arriba parecen corresponderse
con las onglides y offglides que sugieren Clark et al (2007).
• Epéntesis consonántica: CV1 + V2 >.CV1. CV2.
Inserción de una consonante en medio del grupo de vocales en contacto.
Sanicky (1989) encontró ejemplos de epéntesis de una oclusiva glotal en Misiones,
Argentina:
7) paraíso [pa. ɾa.ʔí.so] reúno [re.ʔú.no]
Garrido (2007) ilustra esta estrategia en español colombiano con:
8) canoa [ca.no. ɣa]
En español mexicano podemos escuchar:
9) creía [kɾe. í βa] traía [tra.í. βa] moho [mo.xo]
• Elisión: CV1 + V2 >.CV2 (:). Ó CV1(:) .
Una de las vocales se elide. En algunas lenguas puede suceder un alargamiento
vocálico, sobre todo si se trata de la misma vocal.
12
10) lee [le] leerás [le.ɾás] alcohol [al.kol]
• Fusión: CV1 + V2 > .CV3 (:).
Una secuencia de vocales V1 + V2 se realiza como una tercera vocal, la cual comparte
algunos rasgos con el par de vocales originales. Jenkins (1999) reporta el siguiente
ejemplo, pero éste a nivel postléxico (entre palabras) con múltiples variantes:
11) [no.me.a.kweɾ. ðo]  [no.mæ. kweɾ. ðo]
[no.mɑ. kweɾ. ðo]
[no.mɛ. kweɾ. ðo]
[no.mo. kweɾ. ðo]
[no.mə. kweɾ. ðo]
• Formación de deslizada: CV1 + V2 > .CGV2(:).
Según Casali (1996), las vocales se pronuncian en la misma sílaba, pero la primera
vocal emerge en la superficie como deslizada. En español, la resolución de hiatos con
formación de deslizada no sólo se realiza en la primera vocal, sino que también puede
haber deslizamiento de la segunda vocal. Ejemplos del primer caso son los siguientes:
12) teatro [te.á.tɾo]  [tjá. tɾo] aéreo [a.é.reo]  [a.é.rjo]
almohada [al.mo.a.ða]  [al. mwa.ða]
13
Ejemplos del segundo tipo:
13) país [pa.ís]  [pá i̯ s] maíz [ma. ís]  [mái̯s]
cae [ká.e]  [kái̯]
En el primer caso, suponemos que tras la diptongación, hay un cambio en el timbre de la
deslizada al elevarse a alta. En el segundo caso, en el caso concreto de “país” y “maíz”, la
resolución del hiato a través de la formación de deslizada se efectúa acompañado de
desplazamiento acentual y es la segunda vocal la que se desliza. Adelante se describirán
con detalle estos fenómenos que coadyuvan a la resolución de hiato en español. Mientras
tanto, cabe aclarar que, dadas estas particularidades de la lengua española, que difieren un
poco de la propuesta de Casali (1996), en el presente trabajo se utilizará el término
diptongación para referirnos a la estrategia de resolución de hiato que conlleva
necesariamente formación de deslizada, ya sea de V1 o V2 y cuya secuencia muestra dos
objetivos vocálicos.
Por cuestiones de claridad, resulta conveniente describir los diptongos en español. En
breve, éstos se entienden como la pronunciación de una secuencia de dos vocoides
adyacentes en una sílaba. Siguiendo la gramática tradicional, un diptongo ocurre:
Si la secuencia vocálica incluye una vocal media o baja tónica (a,e,o) y una vocal alta
átona (i,u):
14) laico [láj.ko] piano [pjá.no] viejo [bjé.xo]
Face y Alvord (2004) añaden un caso más de diptongo:
14
Si tenemos dos vocales altas (y conviene agregar que deben ser átonas), la primera se
deslizará:
15) ciudad [sju.đáđ] cuidado [kwi.đá.đo]
Esta regla aplica, por supuesto, a los diptongos “naturales” y a los que resultan cuando se
usa la diptongación para resolver un hiato. Como se observa en esta descripción, las
vocales altas son las que se realizan como deslizadas en la superficie al diptongar la
secuencia vocálica. Con esto, se entiende que las deslizadas en español no tienen un valor
fonémico, pues sólo emergen en la superficie en estos contextos de contacto y
diptongación. Hay, sin embargo, un gran debate actualmente sobre la naturaleza fonémica
de las deslizadas en la lengua española. En la sección 2.4 retomamos este tema sobre
vocales y deslizadas y ofrecemos una discusión al respecto.
Tradicionalmente en la lingüística hispánica se le llama semiconsonantes a los vocoides
altos que resultan de una diptongación de una secuencia vocálica en las que ellos ocupan
la primera posición; es decir, ellos son la V1 previamente a la diptongación. Ya que
prescriptivamente en español sólo las vocales altas [i, u] pueden deslizarse, tenemos sólo
los siguientes símbolos fonéticos para las semiconsonantes: [j, w]. Por otra parte, se les
llama semivocales a los vocoides altos que ocupan la segunda posición en la secuencia y
que se deslizan como efecto de la diptongación. Los símbolos que generalmente se
utilizan para representarlos fonéticamente son: [i̯ , u̯]. Como puede observarse en los
ejemplos del inciso 12, los diptongos del primer caso forman semiconsonantes y en los
del inciso 13, semivocales. Para efectos de este estudio, se usará el término deslizada para
referirse a ambas semiconsonantes y semivocales, siempre y cuando no sea necesaria la
distinción.
15
Matluck (1995) distingue entre diptongación “estándar” y diptongación “no estándar”. La
primera se refiere a los diptongos que resultan de la unión de dos vocales distintas en una
sílaba, siendo una de ellas alta y átona. Ésta cambia su forma fonética de vocal a
semiconsonante [j], [w] o semivocal [i ̯], [u̯], y pierde su nuclearidad. Por ejemplo:
[pjén.so], [sjés.ta] , [ói ̯.ɣo], [páu̯.sa].
La diptongación “no estándar”, por otra parte, ocurre cuando en una secuencia de vocales
diferentes una de ellas es una vocal media /e/ u /o/, y ésta se realiza como deslizada tal
como la hace una vocal alta. Es decir, hay un cambio de timbre y un deslizamiento que
resulta en [j] o [w]. Ejemplos de esta diptongación no estándar son /pe.ór/  [pjor];
/é.ro.e/  [é.rwe]. Los ejemplos del inciso 12 muestran este tipo de diptongación “no
estándar” al que Matluck se refiere.
Como se ha visto hasta aquí, aunque la formación de hiatos en la lengua española es
bastante predecible, los hablantes se valen de un conjunto de estrategias y recursos
fonológicos para evadir dichos hiatos; y los resultados pueden ser diversos dependiendo
del uso de unos u otros. La Real Academia Española y la literatura sobre resolución de
hiatos admiten que en algunos dialectos se evitan los hiatos y que hay variación con
respecto a las estrategias y condicionantes lingüísticas para dicha resolución. Esto se ha
observado tanto en el nivel léxico como en el postléxico (véase Henríquez Ureña, 1938,
1976; Matluck, 1951; Navarro Tomás, 1966; Lope Blanch, 1972, 1983. 1996;
Perissinoto, 1975; Suárez,1980; Canfield, 1981; García Fajardo, 1984; Williamson, 1986;
Ávila, 1990; Quilis, 1993; Moreno de Alba, 1994; Lipski , 2006; Morris, 1998; Aguilar,
16
1999; Martínez-Gil, 2000; Jenkins, 1999; Hualde y Prieto, 2002; Vuskovich, 2006; Alba,
2005, 2006; Garrido, 2007; Chitoran y Hualde, 2007).
La pregunta obligatoria entonces es cómo está condicionada dicha variación. La
investigación más reciente al respecto, de hecho, ha tenido como objetivo describir esta
variación existente y desde diferentes perspectivas se ha confirmado la presencia de
factores dialectales, lingüísticos, estilísticos y sociales que condicionan el uso de las
estrategias de resolución de hiatos en español. En las siguientes páginas abordamos este
fenómeno de variación de la resolución de hiatos con algunos de los hallazgos más
relevantes.
2.2. Variación en la resolución de hiatos en español
El fenómeno de la resolución de hiatos ha sido investigado desde diferentes perspectivas
teóricas, distintas metodologías, y en varios dialectos. Así, analizando las descripciones o
hallazgos, se ha podido identificar variación en las estrategias usadas. Los estudiosos del
fenómeno se han dado a la tarea también de describir las condicionantes o restricciones
que rigen el uso de una u otra estrategia. Estas constricciones se clasifican en general en
factores externos (sociales, dialecto, estilo) e internos (lingüístico-estructurales). En esta
sección revisaremos algunos de estos factores que han sido descritos en la literatura.
2.2.1 Variación y factores externos
En español, la diptongación ha sido una estrategia común documentada en la resolución
de hiatos. Esta estrategia, como previamente se señaló, implica la formación de
deslizadas [j, w] teniendo como fuente las vocales altas /i, u/ o las vocales medias /e, o/;
17
éstas últimas cambian en algún punto de timbre para poder llegar a ser deslizadas altas.
Otros ejemplos son: /pe.rí.o.đo/  [pe.rjó.đo]; /gi.ó/  [gjo]; /pe.le.ó/  [pe.ljó];
/gol.pe.ár/  [gol.pjar].
María Vaquero (1996) en las Antillas; Lope Blanch (1996, 2000) en México; Quesada
Pacheco (1996) en Centro América; Sedano & Bentivoglio (1996) en Venezuela; Montes
(1996) y Garrido (2007) en algunas regiones de Colombia; Sanicky (1989) en Argentina;
y Lipski (2004) en Costa Rica han identificado esta estrategia como una de las más
comunes en la resolución de hiatos. Hualde y Prieto (2002), Hualde et al (2008), y
Aguilar (2005, 2006) reportan esta estrategia en España.
Aunque la diptongación parece ser una estrategia predominante en la resolución de hiatos
en el mundo de habla hispana, Frago-Gracia y Franco-Figuera (2001) declaran que esta
estrategia es una característica general sólo del español de América. A su vez, Hualde
(2005) sostiene que los dialectos en Latino América favorecen la diptongación más que el
español peninsular en estilo formal. No obstante, se ha reportado Bolivia como un país
donde se conservan los hiatos (Coello Vila, 1996). Aparentemente resulta, entonces, que
la variación con respecto del mantenimiento o no del hiato depende del dialecto en
cuestión.
Siguiendo con diferencias dialectales, NavarroTomás (1990) señala que cuando dos
vocoides altos pertenecen a la misma sílaba, el primero es el que se desliza en la mayoría
de los dialectos. Por ejemplo, [kwi. ða] y [sju. ðað]. Sin embargo, en otros dialectos
puede ocurrir lo contrario; el segundo vocoide es el que se hace deslizada: [kuj. ða] y
[siw. ðað]. Alarcos Llorach (1971) subraya que esta variación no es tan sólo dialectal,
18
sino también intra-hablante; es decir, que el mismo hablante algunas veces hace deslizada
el primer vocoide y otras veces, el segundo.
La velocidad de habla y el estilo han sido consideradas como otras variables en la
resolución de hiatos (D’Introno et al., 1995; Hualde et al., 2001; Alba, 2005, Martínez-
Gil, 2000). Con respecto a velocidad, Jenkins (1999) sostiene que “[…] Hiatus clusters
are affected a great deal by rate of speech, with andante speech rendering high numbers
of heterosyllabication”2 (p.13). Morris (1998), investigando el español chicano, el
mexicano y el peninsular, encontró que a mayor velocidad en el habla, mayor es la
tendencia a resolver el hiato con diptongación o con elisión.
Por su parte, Garrido (2007) comparó dos dialectos regionales del español colombiano y
demostró que, al usar dos tareas diferentes para motivar los estilos formal e informal, se
presentan claras diferencias en la resolución de hiato, pues en un estilo formal o cuidado
se favorece el mantenimiento del hiato. Ella utilizó una lista de palabras para elicitar el
estilo formal y una narración para el estilo informal.
En cuanto a factores sociales, de manera recurrente en la literatura se ha asociado el uso
de estrategias para evadir los hiatos con gente inculta o de clase socioeconómica baja
(Navarro Tomás, 1990; Matluck, 1995; Barrutia y Schwegler, 1994), o con gente rústica
u originaria de áreas rurales. Esta atribución se ha reportado en Puerto Rico por Álvarez
Nazario (1990); Moreno de Alba (1994) lo ha hecho en México; y Flórez (1951) en
Colombia. Asimismo, Alarcos Llorach (1995), en la Gramática del español, afirma que
2
Harris (1969) distinguió cuatro diferentes tipos de velocidad de habla en el dialecto de la Ciudad de
México. Esto son: Largo (lento y muy preciso); Andante (no tan lento y típico del habla cuidada);
Allegretto (más rápido y típico del habla casual; y Presto (extremadamente rápido y sin ningún tipo de
monitoreo).
19
los diptongos derivados de una secuencia vocálica que originalmente formaba hiato son
coloquiales y vulgares. De esta manera, se observa que el nivel educativo o las
dicotomías rural vs. urbano, vulgar vs. estándar se han tratado como factores
condicionantes del fenómeno de resolución de hiatos. Dado que en la presente
investigación se considerarán variables sociales, a continuación resumimos algunos
estudios que han incorporado este tipo de variables en la investigación sobre hiatos.
Perissinotto (1975) estudió la producción de hiatos en la ciudad de México considerando
edad, género y estatus socioeconómico como variables sociales y limitando su análisis a
los grupos vocálicos /ea/, /oa/ y /oe/ a nivel léxico (secuencias dentro de la palabra). Sus
resultados demuestran que 72.1% de los informantes evitan los hiatos utilizando
principalmente la diptongación como estrategia de resolución; los hombres resuelven los
hiatos un 82.7% de todos los casos posibles, mientras que las mujeres lo hacen un 65.3%;
la edad no resultó ser una variable significativa; y en cuanto al estatus socioeconómico,
los grupos de clase baja y media produjeron relativamente igual porcentaje de casos de
resolución de hiato (evasión del hiato): 75.7% and 77.5%, respectivamente. La clase alta
evitó los hiatos en un 64.5%. Perisinotto destaca que es sólo en la clase alta donde
predomina el hiato como norma.
Sanicky (1989) llevó a cabo un estudio en Misiones, Argentina donde entrevistó a 129
informantes. Su propósito fue identificar las estrategias de resolución de hiato y su
frecuencia según los dialectos regionales de Misiones. Para ello, analizó secuencias
vocálicas tanto en el nivel léxico como en el postléxico; y usó el nivel cultural (basado en
ocupación, nivel educativo y redes sociales) y la edad como variables externas. Entre sus
hallazgos tenemos que heterosilabificación, epéntesis consonántica, alargamiento
20
vocálico, diptongación y elisión fueron las estrategias más recurrentes. Además, encontró
que a mayor cercanía geográfica con Paraguay, mayor tendencia al uso de la epéntesis
consonántica (oclusiva glotal), pues, explica la autora, que se trata de influencia del
guaraní. En las regiones orientales cercanas a Brasil, se nota una preferencia por la
heterosilabificación, aunque la diptongación es la más usada por todos los dialectos.
Sanicky reportó que los hablantes mayores de 40 años y los que pertenecen a niveles
culturales bajos favorecen la estrategia de epéntesis consonántica más que la
heterosilabificación o la diptongación.
En el dialecto mexicano, Moreno de Alba (1994) reporta que en el Atlas Lingüístico de
México (Lope Blanch 1990) la diptongación de /e/ átona seguida de vocal fuerte en
interior de palabra es un fenómeno que “no parece privativo de determinado nivel
sociocultural, sino que prácticamente se da por igual en hablantes analfabetas que de
cultura media” (p. 52). No obstante, señala que en los lugares en que la diptongación no
es tan frecuente, ésta es más característica de hablantes de bajo nivel social. También,
agrega, que este tipo de diptongación se produce con mayor frecuencia en áreas rurales.
Manteniendo el mismo contexto fonético, pero pasándolo al nivel de lindes de palabras,
el mismo Moreno de Alba resalta que la diptongación en este caso es característica de
hablantes de niveles socioculturales bajos y de zonas rurales más que de hablas urbanas.
En un estudio interdialectal, Matluck (1995) investigó las actitudes de los hablantes hacia
la aceptabilidad social de la resolución de hiatos (eliminación) en el nivel postléxico. Su
muestra consistió de cinco grupos de 10 personas del habla culta de cinco capitales de
países hispanohablantes: Buenos Aires, Argentina; La Paz, Bolivia; La Habana, Cuba;
ciudad de México; y Caracas, Venezuela. Los resultados demuestran que 46%
21
mantuvieron el hiato, mientras que el resto optó por alguna estrategia de eliminación del
hiato. Esto sugiere que la intolerancia hacia el hiato en Latinoamérica es un fenómeno
que permea en todos los grupos sociales, incluidos los del habla culta.
Vuskovich (2006) estudió la resolución de hiatos en la ciudad de México desde una
perspectiva sociolingüística considerando la edad y el género como variables externas, y
los grupos vocálicos /a + e/, /e + a/, /o + a/ y /o + e/ en el nivel postléxico. El autor
encontró que la mayoría de estos grupos permanecen heterosilábicos, es decir, el hiato se
mantiene. Sin embargo, cuando la resolución se efectúa, se recurre principalmente a las
siguientes estrategias con la frecuencia correspondiente al orden de aparición: 1)
formación de deslizada de vocal no alta3 V1, 2) formación de deslizada de vocal no alta
V2, 3) elisión de V1, 4) elisión de V2 y 5) formación de deslizada alta de V1. En cuanto a
las variables sociales, se encontró que el uso de las estrategias varía dependiendo del
género, ya que las mujeres tienden a elidir más la V1 y los hombres, la V2. Además, las
mujeres usan en menor medida la formación de deslizada no alta de la V2 que los
hombres. Otro resultado interesante es que entre los grupos etarios considerados, el de las
personas mayores produjo más hiatos que los otros grupos más jóvenes. Otro hallazgo fue
que los mayores no recurrieron a la estrategia de elisión, mientras que los jóvenes la
usaron considerablemente.
Un caso especial y relacionado con la variación de la resolución de hiatos es la
hipercorrección. Aunque en la literatura no se encuentran ejemplos de este fenómeno, es
3
En la presente tesis la llamo deslizada media porque las secuencias implicadas no incluyen la vocal baja
en primera posición; es decir, es siempre un vocoide medio el que aparece en primera posición y el que se
desliza manteniendo el mismo timbre vocálico o cambiándolo a alta. De ahí la distinción entre deslizada
alta y media.
22
conveniente señalar que en español mexicano se puede observar el uso de las desinencias
de los verbos –ear para los verbos –iar, con mantenimiento del hiato. Por ejemplo,
algunos dicen “No me copees” en vez de “No me copies’’ o “Ya lo vaceé” por “Ya lo
vacié”, o “Negocear” por “Negociar”. Sugerimos que son casos de hipercorrección
porque, al parecer, los hablantes confunden las reglas normativas y las de uso y para
“evitar” caer en errores extrapolan las reglas para los verbos –ear a los verbos –iar
reteniendo los hiatos implicados. Cabe agregar que generalmente se escuchan estas
formas hipercorrectas en personas de distinto nivel social.
Lo que parece ocurrir es que, dado que una estrategia frecuente para resolver el hiato en
los verbos –ear es la diptongación con elevación de la vocal media teniendo como
resultado [j] + V (ejemplo [pa.tjé]), algunos hablantes que intentan apegarse a la norma
prescrita y que conscientemente saben que la diptongación como estrategia de resolución
no es la forma estándar, evaden el resultado de deslizada más vocal en todas las formas
verbales que producen dicha secuencia. Consecuentemente, ya que las conjugaciones de
los verbos –iar implican la combinación [j] + V (ejemplo [ko.pjé]), estos hablantes
“hipercorrectos” aplican las reglas de conjugación de los verbos –ear que
normativamente prescriben el mantenimiento de los hiatos.
2.2.2 Variación y factores internos
A diferencia del limitado número de estudios que han integrado variables sociales para
abordar la resolución de hiatos, varios lingüistas se han dedicado al estudio de la
variación de este fenómeno desde un enfoque meramente lingüístico, analizando sólo
variables internas. (Ver, por ejemplo, Morgan, 1984; Rosenthall, 1994; Méndez, 1998;
23
Senturia, 1998; Jenkins, 1999; Martínez-Gil, 2000; Hualde y Prieto , 2002; Face &
Alvord, 2004; Aguilar, 2005 and 2006; Alba, 2005; Bakovic, 2007; Chitoran & Hualde,
2007; Hualde et al., 2008). Así, a partir de intuiciones y de un dialecto en particular, este
tipo de investigaciones ha ofrecido valiosas descripciones y explicaciones de la variedad
de las estrategias y los usos de las mismas dependiendo de restricciones lingüísticas que
se han identificado. Especial énfasis se ha hecho en la descripción de estas restricciones
que influyen la selección de una u otra estrategia para resolver los hiatos y que,
precisamente, conllevan a la variación existente en diferentes dialectos o idiolectos.
Abajo discutiremos algunas de estas restricciones identificadas y que dan pie a diferentes
formas de resolver los hiatos y, por ende, a la variación de este fenómeno.
Bakovic (2007), por ejemplo, afirma que una diferencia entre el español chicano y otras
variedades es que:
[ ] the otherwise expected stress on the vowels involved is irrelevant to the hiatus
resolution strategy employed; if either vowel would otherwise be stressed, then
the resulting vowel is stressed; otherwise, it is unstressed. In other Spanish
varieties, the otherwise expected stress pattern directly influences the choice of
hiatus resolution strategy (or even whether there is one) (p. 1).
El autor reporta las siguientes estrategias en español chicano:
Coalescence (o elisión en otros análisis) de vocales idénticas.
a. lo odio [lo.ðjo] b. mi hijo [mixo]
Elisión de vocales bajas (antes de cualquier vocal inicial).
a. la iglesia [liɣlesja] b. paga Evita [paɣeβita]
24
Formación de deslizadas altas (diptongo de sonoridad creciente)
a. mi última [mjultima] b. mi hebra [mjeβɾa]
Formación de deslizadas medias (V1 es una vocal media y V2 difiere de ésta en altura o
anterioridad resultando en un diptongo de sonoridad creciente).
a. me urge [mjuɾxe] b. pague ocho [paɣjoʧo]
Fusión de vocales medias o altas
a. se hinca [siŋka] b. como uvitas [komuβitas]
Bakovic sugiere que en otras variedades del español las estrategias para resolver el hiato
son diferentes por la influencia del acento; es decir, en español chicano puede haber
traslación o dislocación del acento, mientras que en otros dialectos esto no es posible.
Morris (1998) y Martínez-Gil (2000) compararon la resolución del hiato en lindes de
palabras en los dialectos chicano, mexicano y peninsular. Los datos para el análisis se
tomaron de las intuiciones de hablantes nativos o de ejemplos comunes en la literatura
sobre dicho fenómeno. Morris (1998) abordó su estudio usando el marco de la Teoría de
la Optimidad e incluyó el estilo como variable. Encontró que en el español peninsular, la
resolución de hiatos está condicionada por la jerarquía o escala de sonoridad de las
vocales involucradas, incluso si esto significa la producción de deslizadas al inicio de
palabra. Por otra parte, en el español mexicano, la estrategia preferida - diptongación-
forma deslizadas en todos los casos, tanto altas como medias. De igual manera, en
25
español chicano la tendencia es resolver los hiatos con diptongación, pero en este dialecto
todas las deslizadas resultan altas, ya sea porque la vocal involucrada era alta
originalmente o porque las vocales medias se deslizan y después se produce una
elevación a alta.
Observando la función del acento en estos dialectos, Morris encuentra que en español
peninsular todas las vocales tónicas pueden formar diptongos en los lindes silábicos entre
palabras, lo cual significa que se pueden formar semiconsonantes o semivocales. La
forma que tomen los vocoides en cuestión dependerá de su grado de sonoridad en la
escala; es decir, el núcleo recién formado del diptongo debe constituir la cima de
sonoridad de la sílaba y el vocoide periférico de menor grado de sonoridad entonces se
conformará en una semiconsonante o semivocal. Esta condición, por tanto, es la que
posibilita la traslación acentual en este dialecto, ya que si la vocal tónica es la menos
sonora, entonces el acento será trasladado a la vocal más sonora. Morris (1998) cita
ejemplos de otras fuentes (Navarro Tomás, 1967; y Hualde, 1994):
la hija  l[áj]ja
de ambos  d[eá]mbos
menú antiguo  men[wá]ntiguo

acné inoportuno  acn[éj]nopurtuno
En español mexicano, por otra parte, una vocal tónica no puede deslizarse. Una
semivocal se deriva de una V2 si la V1 está acentuada, sin importar la escala de sonoridad.
Si la V2 recibe acento, entonces la V1 se desliza volviéndose semiconsonante. Por tanto,
en este dialecto el acento bloquea la formación de deslizadas, ya que la dislocación
acentual no es aceptable.
26
En español chicano, la diptongación conlleva siempre formación de semiconsonantes sin
importar la ubicación del acento o el nivel de sonoridad de las vocales en el grupo. Sin
embargo, si la última condición se requiriera, ésta se satisfaría pues el elemento no
nuclear en la secuencia es siempre una semiconsonante (deslizada ante vocal nuclear) y
ésta es de menor nivel de sonoridad que cualquier otra vocal, según las escalas propuestas
para español (Hualde, 1995). La traslación acentual se observa en este dialecto, pero la
dirección en cualquier caso es de la V1 a la V2: ‘Habl[wá]dán’.
El análisis de Bakovic (2007) coincide con el de Martínez-Gil (2002) en cuanto a la
tendencia en español chicano a resolver los hiatos con diptongación. Además, ambos
concuerdan en que la formación de deslizadas ocurre en dos contextos: una vocal alta
adyacente a otra vocal diferente se deslizará; o una vocal media se eleva a vocal alta
cuando aparece contigua a otra vocal diferente y se desliza; dos vocales idénticas se
fisionan en una; la vocal /a/ siempre es elidida cuando antecede a otra vocal; una vocal
media se elide cuando está antes de una vocal alta de la misma anterioridad; en el resto de
casos, la V1 es la que siempre pierde su silabicidad. En español mexicano, se observa
algo similar, según el mismo Martínez-Gil, aunque hay un poco de variación: sólo las
vocales átonas pueden ser desilabificadas. Por otra parte, en español peninsular, la
pérdida de silabicidad está condicionada por la sonoridad de los elementos en cuestión
según la escala de sonoridad: la vocal con menor nivel de sonoridad es la más proclive a
volverse deslizada independientemente de su posición en la secuencia.
Estos resultados demuestran, por tanto, que la resolución de hiatos en estos dialectos está
motivada por factores lingüísticos o por constricciones diferentes, o, de acuerdo con la
Teoría de la Optimidad (Prince y Smolensky, 2004), por un orden diferente en la
27
aplicación de estas condiciones. En resumen, tenemos que, mientras que el español
chicano recurre a la diptongación siempre que hay dos vocales disímiles en contacto (lo
cual incluye la elevación de vocales medias), el español mexicano se constriñe por el
acento y su posición en la secuencia vocálica; el español peninsular resuelve los hiatos de
vocales distintas considerando la sonoridad de los segmentos en cuestión: la de menor
sonoridad se deslizará. Veamos esto ilustrado:
/lo úso/
chicano [lú.so]
mexicano [lú.so] o [lo.ú.so]
peninsular [lów.so]
Siguiendo a Martínez-Gil, en español chilcano este resultado implica dos procesos: V1,
una vocal media, se eleva a alta; después, teniendo como resultado una secuencia de dos
vocales idénticas /uú/, una de ellas se elide. En español mexicano, el autor propone lo
mismo que para el chicano, pero según mi experiencia, también puede mantenerse el
hiato. La estrategia de diptongación no es viable ya que no se permite dislocación
acentual y el acento reside sobre la /u/, que es la que se deslizaría. En español peninsular,
el resultado es un diptongo con el acento dislocado a la vocal media, pues ésta es más
sonora que la vocal alta en la secuencia, la cual se vuelve entonces deslizada.
Otro estudio relevante es el de Hualde y Prieto (2002). Su objetivo fue investigar la
alternancia vocal-deslizada, es decir, el contraste léxico entre secuencias formando hiato
o diptongo: [du.é.to] vs. [dwé.lo] y [pi.é] vs. [pje] con la finalidad de conocer cuán
extenso era el fenómeno de este contraste y si la clasificación en hiato o diptongo que
28
hacen los hablantes era consistente en el mismo dialecto. Se condujeron dos
experimentos con seis hablantes de Madrid. Éstos consistieron en una prueba de
actuación (lectura de una lista de palabras insertadas en una oración) y una prueba de
competencia (intuiciones sobre silabeo). Sólo se incluyó la secuencia /ia/. Los
informantes repitieron los enunciados tres veces y fueron grabados. Para el análisis, se
obtuvieron las medidas de duración de las secuencias y los promedios por sujeto.
Atendiendo la prueba de competencia, los resultados demuestran que sólo tres sujetos
coincidieron completamente con la silabifiación propuesta por las intuiciones de los
autores. La silabificación de un informante, por otra parte, se desvió considerablemente
de la de los autores. La prueba de actuación (con las medidas de duración obtenidas)
arrojó resultados congruentes con la presuposición de los autores sobre la separación de
las palabras con secuencias diptongadas o hiatizadas en dos clases léxicas. Sin embargo,
estos resultados mostraron variación no sólo del tipo inter-hablante (de uno a otro
hablante), sino también intra-hablante (variación que produce la misma persona).
Face y Alvord (2004) replicaron el estudio de Hualde y Prieto considerando factores
léxicos y acústicos en la percepción del contraste diptongo vs. hiato excepcional
(mantenimiento del hiato en contexto propio de un diptongo) en español peninsular. El
factor léxico era, en concreto, el efecto del ítem léxico individual; y el factor acústico
consistió en las diferencias de duración. Condujeron dos experimentos: una prueba de
producción y tres de percepción con cinco estudiantes universitarios originarios de
Barcelona.
29
El primer experimento fue una réplica del de Hualde y Prieto. Los resultados muestran
que los informantes coincidieron en gran medida en la clasificación de las palabras según
si contenían un hiato o un diptongo; sus intuiciones fueron también muy consistentes con
la hipotética silabificación sugerida por Hualde y Prieto. Nuevamente sólo un informante
se desvió de esta propuesta, ya que la mayoría de las veces silabificaba hiatos cuando se
esperaban diptongos.
En cuanto a la prueba de producción, el promedio de duración de los hiatos hipotéticos
fue mayor que el de los diptongos hipotéticos en el habla de cada hablante, lo cual
confirma también los hallazgos de Hualde y Prieto. Face y Alvord (2004) también
reportan una clara “variation in the mean durations between speakers, and no absolute
threshold could be proposed for the durational boundary between the diphthongs and the
hiatuses, even if only the means (and not the individual tokens) are considered” (p. 558).
Los autores sugieren que esta variación dificulta que los oyentes distingan entre hiatos y
diptongos si se producen por diferentes hablantes. También con este estudio se observó
variación inter-hablante e intra-hablante tanto en la producción como en la percepción de
diptongos e hiatos excepcionales. Los autores concluyen que el factor acústico (la
duración de las secuencias) es uno de los principales aspectos que afecta la distinción
perceptual, con gran precisión, entre hiatos y diptongos. La naturaleza de los ítems
léxicos contribuye en gran medida a la precisión con la que la silabificación de la
secuencia se percibe.
Jenkins (1999) estudió la resolución de hiatos en lindes de palabras en el español de
Nuevo México. Él halló lo siguiente: diptongación 42.2%; elisión de V2 24.6%;
heterosilabificación, menos del 10%; fusión 7.1%; y epéntesis 0.5%. Entre todos los
30
casos de diptongación, 90% forman diptongos crecientes (ya sea con vocales altas
subyacentes o con medias elevadas a altas). Aunque Jenkins llegó a algunas predicciones
en cuanto al uso de estas estrategias, él notó variación en este fenómeno: “What is most
difficult and frustrating when making predictions and descriptions based on the data is
the fact that there is variation. There is no absolute when making linguistic predictions,
but rather general tendencies”. (p. 49).
Alba (2005) también abordó la resolución de hiatos entre palabras en el español de Nuevo
México y encontró mucha variación inter- e intra-hablante. Sin embargo, él descubrió que
la variación en este fenómeno es sistemática y sigue determinados patrones
condicionados por factores como la calidad de la vocal, la frecuencia, el acento, el tipo de
sílaba, la mención previa, y la clase de palabra. El autor observa que en investigaciones
anteriores se ha llegado a descripciones y predicciones de la resolución de hiatos
tomando en cuenta diferentes factores, pero subraya que dichas predicciones varían de un
dialecto a otro; es decir, él sugiere que no debemos ser categóricos en las predicciones
porque el dialecto es una variable relevante a considerar en este fenómeno. Ilustra esto
con las predicciones que hacen Martínez-Gil (2000) y Jenkins (1999) sobre el español
chicano y el de Nuevo México, respectivamente.
 La vocal baja /a/ siempre se elide cuando antecede a otra vocal (Martínez-Gil,
2000: 517)
Habla inglés [áβliŋ.glés]
 La elision de V2 ocurre cuando una vocal baja precede una vocal media o alta
átona (Jenkins, 1999:52)
31
Habla inglés [áβlaŋ.glés]
 Una vocal media (tónica o átona) se elide cuando le prosigue una vocal alta con la
misma retracción de la lengua (Martínez-Gil, 2000: 517)
Compré higuitos [kom.pɾí.ɣí.tos]
 Los elementos tónicos nunca son alterados en la resolución, a menos que estén
adyacentes a otro elemento tónico; el hiato se mantiene cuando una vocal tónica
precede a una vocal distinta de /e/ (Jenkins 1999:52-53)
Compré higuitos [kom.pɾé.i.ɣí.tos]
Como se puede notar, estas predicciones conllevan diferentes resultados en los dialectos
en discusión, lo que sugiere que cada dialecto se rige por diferentes constricciones.
Aguilar (2006) condujo un experimento similar al de Hualde y Prieto (2002), pero ella lo
hizo al nivel postléxico (entre palabras). Su propósito fue observar la resolución del hiato
a partir de tres estrategias en particular: la heterosilabificación (mantenimiento del hiato),
la diptongación y la elisión. Su muestra consistió en cinco hombres universitarios del
centro de España, y su experimento comprendió dos tareas: una lectura de frases y una
conversación controlada en parejas. Las secuencias vocálicas a analizar eran /aa/, /ae/ y
/ai/. Reportó que la estrategia más común de resolución fue la heterosilabificación (45%),
seguida de diptongación (32%), y elisión al final con (23%). Encontró que el acento
parece ser el factor determinante en la selección de la estrategia para resolver el hiato. De
acuerdo con Aguilar, si V1 es tónica, pero V2 es átona, entonces la estrategia más común
32
es diptongación. Por el contrario, si V2 es tónica y V1 es átona, se prefiere mantener el
hiato.
Desde una perspectiva histórica y considerando varias lenguas, Chitoran y Hualde (2007)
estudiaron la evolución de las secuencias vocálicas en las lenguas romances observando
en particular que la variación en la pronunciación de las secuencias iV puede incluir
realizaciones con diptongo [jV]. Ellos sugieren que en francés e italiano hay una
tendencia a producir consistentemente diptongos con secuencias de vocoides de
sonoridad creciente. En español, algo similar ocurre, pero los hiatos son posibles o
preferidos en algunos casos. Observan una gran variación dialectal e interdialectal en esta
lengua. Por otra parte, en rumano y portugués, hay una preferencia por los hiatos.
Aclaran también que en rumano hay un contraste entre hiatos y diptongos en algunos
ítems léxicos, pero esto no sucede en portugués. El esquema siguiente muestra estas ideas
como un continuo:
(Chitoran y Hualde 2007, p. 40)
Figura 1 Continuo diptongo-hiato en lenguas romances
Los autores explican la variación en el grado de contraste entre diptongos e hiatos en
estas lenguas a partir de factores históricos y prosódicos:
(i) the stable coordination of diphthongs as general articulatory

attractors, affecting the ‘direction’ of the change;
33
(ii) pre-existing unambiguous [jV] diphthongs from other sources
as language-specific attractors, affecting the ‘speed’ of the change;
(iii) prosodically determined lengthening of iV, which can inhibit
diphthongisation and affect the ‘trajectory’ of the change by
determining gradient patterns of hiatus to diphthong shifts in the
lexicon. (p. 64)
Si comparamos los resultados de las investigaciones abordadas en esta sección, es
evidente que hay varias maneras de enfrentar los hiatos y que una estrategia puede ser
más común en un dialecto que en otro; que no necesariamente se usan las mismas
estrategias en las diferentes variedades del español; que tampoco son las mismas
utilizadas en el nivel léxico que en el nivel postléxico; que los hablantes del mismo
dialecto usan recursos diferentes ante el hiato, y que incluso un mismo hablante puede
mostrar variación en sus estrategias. Alba (2005), consciente de esto, concluye que:
It would be inappropriate, therefore, to propose a set of

formal generalizations about hiatus resolution as previous
accounts have done based on the patterns found. Such facts
lead us to conclude that, hiatus resolution does not conform
to a set of formal, abstract rules, but rather, that there is
inherent variability. (p. 229)
Sin embargo, si acordamos que la variación no es libre ni desordenada, siguiendo un
método y una teoría adecuados podemos intentar contribuir a describir dicha variación a
partir de otros dialectos y perspectivas. Para esto, hemos ya revisado en las páginas
anteriores que la variación puede estar condicionada por factores internos y externos.
Dentro de estos últimos, género, edad, educación, y estatus socioeconómico se
discutieron ya además de estilo y velocidad. Algunos aspectos internos como el acento y
la sonoridad se mencionaron brevemente. Es necesario ahora dedicar un espacio a las
34
descripciones y explicaciones que se han dado sobre los factores lingüísticos y su papel
en la resolución de hiatos.
2.3 Factores lingüísticos como condicionantes de la resolución de hiatos
A continuación se presenta un resumen de algunos factores lingüísticos condicionantes
del uso de estrategias para resolver los hiatos en español, según las predicciones de
diferentes estudiosos (cfr. Alba, 2005: 3-4). Ya que la presente investigación se limita al
estudio de la resolución de hiatos en el nivel léxico, el resumen original se ha reducido o
expandido considerando el posible efecto de los factores en el nivel léxico.
1. Tipo de sílaba. Considerando el hiato entre palabras, según Monroy Casas (1980),
la segunda vocal (V2 en adelante) del hiato suele ser elidida si ésta se encuentra en
una sílaba cerrada o trabada.
2. Posición de las vocales. Tendencia a conservar la segunda vocal (V2) más que la
primera vocal (V1 en adelante). (Contreras 1969, Hutchinson & Pinkerton 1974,
Hualde 1994, Casali 1996, 1997; Jenkins 1999, Martinez-Gil 2000).
3. El acento. El acento en una o ambas vocales afecta ciertos tipos de resolución. En
el dialecto mexicano, de acuerdo con Martínez-Gil (2000) y Morris (1998), las
vocales tónicas tienden a mantenerse como nucleares. De la misma manera,
Jenkins (1999) y Alba (2005, 2006) coinciden en que las vocales tónicas en los
lindes de palabra del español de Nuevo México se mantienen mucho más que las
átonas en resolución de hiatos, a menos que la vocal adyacente también sea
tónica.
35
4. Morfemas implicados. Se sugiere que el material fonológico de la raíz es más
resistente al cambio que el material de los afijos. De esta manera, la vocal de una
raíz se conservará más fácilmente que una vocal de un afijo cuando las dos estén
en contacto (Casali 1996, 1997; Jenkins, 1999). Jenkins apoya esta postura, pero
la lleva aun más lejos al sugerir que en los verbos no sólo las vocales en la raíz se
resisten al cambio, sino incluso también las desinencias verbales se resisten a
cualquier tipo de reducción.
5. Contenido léxico. Las vocales en contacto en las palabras de contenido (content
words) se mantienen más que las de las palabras funcionales (function words).
(Casali 1996, 1997; Jenkins, 1999; D’Introno et al., 1995)
6. Restricciones sintácticas. La resolución de hiato a través de la formación de una
paravocal o deslizada ocurre con mayor probabilidad en el siguiente orden: sin
linde> linde morfémico> linde de palabra > linde de frase. (Cressey, 1978).
Podemos agregar tres más a la lista:
7. Grado de sonoridad de las vocales. En el español peninsular, se observa una
tendencia a la diptongación determinada por la sonoridad de las vocales
involucradas. Se sugiere que la vocal menos sonora es la más proclive a sufrir
algún tipo de reducción, sin importar su posición en la secuencia de vocales.
(Navarro Tomás, 1967; Hualde, 1994; Morris, 1998; Martínez-Gil, 2000).
8. Calidad de las vocales. Alba (2005, 2006) reporta que la calidad de las vocales
desempeña un papel crucial para las estrategias de resolución que se seleccionan.
Sus hallazgos indican que si tenemos vocales bajas o medias en la segunda
36
posición (V2) (a#a, a#e, a#o), esta condición favorece la reducción silábica,
mientras que las vocales altas en esta misma posición la desfavorecen. Por otra
parte, Martínez-Gil (2000: 517) sugiere que la vocal baja /a/ siempre se elide
antes de otra vocal en sinalefa, y que las vocales medias (tónicas o átonas) se
eliden cuando están precedidas de una vocal alta con la misma retracción de la
lengua.
9. Efecto léxico. Face y Alvord (2004) encontraron que la percepción de
silabificación de secuencias de vocoides se ve influenciada por la naturaleza del
ítem léxico.
Estos factores no son categóricos de la resolución de hiato en español. Como se advirtió
previamente, éste es un fenómeno variable y algunos factores pueden afectar de manera
interdialectal, pero otros pueden influir sólo un dialecto o una variedad.
Dado que esta investigación está limitada a la resolución de hiatos en el nivel léxico y
concretamente a los verbos –ear del español mexicano, me enfocaré en factores
lingüísticos tales como la calidad de la vocal, la estructura silábica, la calidad de las
vocales, el acento, y el grado de sonoridad. El contenido léxico es irrelevante pues
trabajaré solamente con verbos (palabras de contenido) y no es necesaria la distinción
entre éstas y las palabras funcionales. De igual manera resulta innecesario atender las
restricciones sintácticas, ya que no se distinguirá entre los tipos de lindes. Finalmente,
tampoco se diferenciará el tipo de morfemas implicados porque siempre será el mismo: la
raíz del verbo + desinencia de los verbos –ear (formas finitas y no finitas).
37
Con la intención de tener una idea clara de estos factores internos que constriñen la
resolución de hiato en español, enseguida revisamos algunos conceptos, nociones y
teorías indispensables para entender mejor este fenómeno y su comportamiento.
2.4 Vocales y deslizadas
La diptongación se ha descrito como una de las estrategias más comunes en la resolución
de hiatos en español. Como arriba se indicó, la diptongación en español implica la
formación de deslizadas, ya sea de altas o medias. Este proceso conlleva un cambio de
vocal a deslizada. Por tanto, entender las diferencias entre vocales y deslizadas es
imprescindible para este estudio.
2.4.1 Vocales y deslizadas desde un punto de vista fonético
Según Levi (2004), la constricción, la duración, la amplitud, y la posición en la sílaba se
han citado como indicadores fonético-fonológicos que distinguen las vocales de las
deslizadas. Veamos cada una de ellas.
Constricción
La constricción o manera de articulación se ha considerado por mucho tiempo como una
de las principales diferencias entre vocales y deslizadas. Clark y Yallop (2007), de hecho,
enfatizan la constricción como la característica articulatoria definitiva entre estos
elementos. Asimismo, Crystal (1991) define las vocales como: [… ] “sounds articulated
without a complete closure in the mouth or a degree of narrowing which would produce
audible friction; the air escapes evenly over the centre of the tongue” (p. 376-377).
38
Describe las deslizadas, por otro lado, como “a transitional sound as the vocal organs
move towards or away from an articulation” (p. 153).
Kenstowicz (1994) nota que las deslizadas [y] y [w]4 están muy relacionadas con las
vocales altas /i, u/, y que la diferencia entre ellas es que al articular las vocales, una
constricción lenta ocurre en el dorso de la lengua, entonces la pronunciación se vuelve [j]
y [w]. Para este autor, las deslizadas en inglés son variantes de las vocales altas.
Maddieson & Emmory (1985) demuestran por medio de evidencias acústicas que hay una
diferencia articulatoria entre las vocales altas y las deslizadas en Amharic, Yoruba, and
Zuni, pues éstas se producen con constricciones más estrechas en el tracto vocal.
También Straka (1964) ya había ofrecido evidencias de esta diferencia de articulación.
Duración
Catford (1977) –citado por Levi, 2004– considera que las deslizadas no tienen un estado
continuo o estable, pero que los percibimos aún así como segmentos. Él argumenta que
las vocales y las deslizadas son lo mismo en cuanto a la constricción, pero que su
diferencia radica en su “notable” duración.
Amplitud
La amplitud ha sido otra propiedad usada para distinguir las deslizadas de las vocales
(Jones, 1918; Sweet, 1890 –citados por Levi, 2004–). Clark et al. (2007) definen amplitud
como “[…] a measure of the size of vibration or the extent of movement in the vibration.
4
Los símbolos de la AFI [j] y [w] se usarán en este estudio para la deslizada alta anterior y posterior,
respectivamente, pero mantengo los símbolos de otros autores al citarlos.
39
Amplitude relates to what we normally call loudness, and as the amplitude of a vibration
diminishes, it becomes less audible” (p. 205). De esta manera, se sugiere que las
deslizadas se producen con menos esfuerzo respiratorio comparado con la pronunciación
de las vocales.
Posición en la sílaba
De acuerdo con Jakobson, Fant and Halle (1952), las deslizadas en inglés no tienen un
estatus fonémico. Generalmente se ha pensado que la posición en la sílaba es lo que
determina la diferencia entre vocales y deslizadas. Ladefoged (2001) -y un sinnúmero de
lingüistas- define las vocales como vocoides silábicos y las deslizadas como vocoides no
silábicos, aunque admite los significados imprecisos de los términos “sílaba” y
“silábico”. En este mismo sentido, Aguilar (1999) critica el hecho de que la silabicidad se
use como criterio para distinguir entre una vocal y una deslizada, pues arguye que la
propiedad de silabicidad no ha sido definida con precisión en términos fonéticos.
Considerando lo anterior, Padgett (2008) resume las distinciones fonéticas encontradas en
la literatura, las cuales se basan en dos principales aspectos:
• En cuanto a la dinámica:
En las vocales se observan lentas transiciones formánticas así como un posible estado
constante o estable; en las deslizadas, las transiciones son rápidas y siempre cambiantes.
• En cuanto a la constricción:
En las vocales, hay formantes intensos y no hay fricación; en las deslizadas, hay
formantes menos intensos y una posible fricación.
40
Padgett (2008:2) ilustra estas diferencias por medio de los siguientes espectrogramas de
[aia], [ai̯ a], y [aja]:
a i a a i̯ a a j a
Figura 2. Espectrogramas de [aia], [ai̯ a], y [aja]
El mismo autor comparó estos grupos vocálicos y observó que el primer grupo trisilábico
[aia] tiene una duración mayor que el grupo disilábico [ai̯ a], y que el primero tiene una
porción más constante/estable. La deslizada en [ai̯ a] consiste principalmente de
transiciones en los formantes y las transiciones del segundo formante parecen más
abruptas lo que significa un tipo de cambio más veloz. Con respecto a [aja], hay una
diferencia en el grado de constricción o fricación, ya que [j] implica más ruido turbulento
en las frecuencias más altas. Con esas categorías y descripciones, Padgett llama
semivocales a las deslizadas que difieren de las vocales sólo en aspectos dinámicos [i̯ / u̯];
y deslizadas consonantizadas a las que difieren en el grado de constricción o fricación
[j/w].
Acústicamente, hablar de deslizadas en español significa hablar de diptongos, pues éste
es el contexto fonológico donde emergen. Aguilar (1999) afirma que los hiatos y
41
diptongos difieren en el dominio de frecuencia temporal: los hiatos tienen una duración
mayor y también un grado mayor de curvatura en la trayectoria de F2 que los diptongos.
Los hiatos pueden tener dos partes estables (continuas o firmes) en la estructura de los
formantes, correspondiendo a cada una de las vocales del grupo, pero en general parece
que el primer y segundo formantes se mueven dirigidos a producir la primera vocal, y
después aparecen dirigidos a producir la segunda vocal sin lograrlo en realidad. Por otra
parte, en los espectrogramas de diptongos, raramente se observan dos partes en estado
estable o regular en la estructura de los formantes; en su lugar, lo que generalmente se
observa es una transición continua de un área de frecuencia a otra (p. 62).
Aguilar (2006) ilustran estas diferencias con los siguientes espectrogramas:
Figura 3. Secuencia [a ‘i] en hiato en copa hípica
42
Figure 4. Secuencia [‘ai] en diptongo en patata iqueña.
Sobre el mismo tema, Martínez-Celdrán (1984) observa que:
[en hiato] espectrográficamente, esas dos vocales mantienen sus

propios formantes bien diferenciados; se saltará de un formante a otro
bruscamente. En cambio, en el diptongo, la glide ha perdido su propia
autonomía, se ha sometido a la vocal que forma el núcleo silábico y esa
dependencia se muestra espectrográficamente como si el formante de la
glide fuese un mero apéndice del núcleo silábico; es, en definitiva, una
transición muy prolongada del segundo formante de la vocal de la que
depende (p.221).
Aunque se ha avanzado con las descripciones de vocales y deslizadas, resulta interesante,
como anteriormente se discutió, que los hiatos y los diptongos están sujetos a
modificaciones debidas a cambios en la situación comunicativa. Así lo demuestra la
misma Aguilar, quien condujo un estudio experimental en el que incluyó como variable
el tipo de comunicación. Para ello, usó una lectura y una conversación controlada en
parejas. Los resultados muestran que, independientemente del tipo de actividad, los hiatos
tienen una duración mayor que los diptongos. Sin embargo, sí hay cierta diferencia entre
los mismos hiatos y diptongos en cuanto al tipo de situación de habla. En la lectura, el
promedio de duración de los hiatos fue de 193 ms (desviación estándar de .44); y 141 ms
43
de los diptongos (desviación estándar de .37). Comparando estos resultados con los de la
actividad de conversación, los datos de la lectura muestran un incremento del 36% en la
duración de los hiatos y, específicamente, de un 26% en el caso de los hiatos palatales y
de un 47% en el de los velares con respecto a los producidos en la conversación.
Desde una perspectiva perceptual, Coren y Warren (2004) llevaron a cabo un
experimento para examinar el papel de la duración en la percepción de las deslizadas y
las vocales en inglés. Usaron dos indicadores de velocidad para los tokens de la palabra
“rodeo”, y veinte sujetos participaron en este estudio. Sus resultados fueron que el 50%
de los oyentes juzgaron el vocoide como vocal y 50% lo juzgó como deslizada cuando la
duración de la V1 era aproximadamente la mitad de la segunda. Los autores llegaron a la
conclusión de que en habla rápida, la duración relativa de V1 es muy importante para
distinguir perceptualmente una vocal de una deslizada.
Considerar estos indicadores fonéticos es crucial para la distinción entre deslizadas y
vocales. Sin embargo, el cuadro sobre las deslizadas no es del todo completo, pues hasta
ahora sólo se ha hablado de las deslizadas altas. En la siguiente sección abordamos las
deslizadas medias, un tema poco abordado en la literatura en español.
2.4.2 El caso de las deslizadas medias
Aunque en la lingüística hispánica tradicional sólo los vocoides altos [j] y [w] se
consideran deslizadas, recientemente un creciente número de estudiosos han acordado,
según sus hallazgos, en la existencia de deslizadas medias en español (Rosenthal, 1994;
44
Nuñez-Cedeño & Morales-Font, 1999; Morris, 1998; Aguilar, 2003; Vuskovich, 2006;
Hualde, 2005; Hualde et al. 2008). Hualde (2005), por ejemplo, señala que:
We can also find midglides [e̯] and [o̯], in colloquial speech, as in bisyllabic
línea [lí.ne̯a] ‘line’, poeta [po̯e.ta] ‘poet’, for more careful trisyllabic [lí.ne.a],
[po.e.ta]. There is no question about the allophonic nature of these midglides.
(p.55)
En consonancia con esto, Hualde et al. (2008) observan que:
The fact that the IPA has special symbols for high glides, [j], [w], but not for
mid glides, which require the use of diacritics on the symbols for mid vowels,
nonsyllabic, [e̯], [o̯] or extrashort [ĕ], [ŏ], appears to reflect the relative
crosslinguistic rarity of nonhigh glides (p.1906).
Resulta interesante notar que la aproximación a estas deslizadas medias en español, en
general, ha sido a través de estudios cualitativos y desde una perspectiva fonológica. En
términos fonéticos, ya Navarro Tomás (1918) reconocía que las vocales medias sufrían
cambios al aparecer de manera contigua a otra vocal, aunque no las llama deslizadas
medias.
las vocales [e], [o] delante de [a] se cierran y abrevian, relajando su articulación,
apagando su sonido y produciéndose, aunque con mayor abertura, con un
movimiento análogo al de las semiconsonantes [j], [w]; en los casos en que se
encuentran juntas las vocales [e], [o], el elemento que se cierra y abrevia es el
que va en primer lugar; detrás de la [a], las vocales [e], [o] se abrevian y relajan
también, pero conservan su propio timbre más claramente que en los casos
anteriores.
Aguilar (2003, 2006) argumenta que fonéticamente el español tiene deslizadas altas y no
altas. En su estudio de 2006, investiga las secuencias vocálicas y su resolución en español
en el nivel postléxico. Para ello, integró un corpus de lecturas con palabras contiguas
(sustantivo y adjetivo) que presentaban las combinaciones vocálicas [a] seguidas de [a],
45
[e], o [i]; e incluían todos los patrones acentuales posibles: [aa], [áa],[aá], [áá], [ae], [áe],
[aé], [áé], [ai], [ái], [aí], [áí]. Se incluyeron estas combinaciones de sustantivo + adjetivo
dos veces en los textos para que el informante la repitiera dos veces y se pudieran hacer
comparaciones. Aunque la autora señala inicialmente que el contexto fonológico que
rodeaba a las vocales comprendía una oclusiva sorda bilabial o dental con el objeto de
neutralizar la influencia de las consonantes, en realidad se observa que también incluyó la
oclusiva velar sorda; es decir, el grupo de consonantes que rodeaban la secuencia
vocálica se conformó por oclusivas sordas. Los informantes fueron cinco hombres
originarios de España.
Con el uso de espectrogramas, se obtuvo información sobre la calidad y duración de las
secuencias y se determinó la resolución usada en la producción de vocales en contacto.
La autora consideró tres categorías: heterosilabificación, reducción (diptongos) y elisión.
Considerando las deslizadas medias como nuestro tema de interés en esta sección,
Aguilar encontró que, en cuanto a los grupos de vocales distintas, los indicadores
acústicos revelan la presencia de un diptongo sin importar si una vocal alta está implicada
o no. Es decir, una secuencia vocálica se vuelve diptongo cuando una de sus partes
constantes o firmes desaparece y se puede ver una transición continua del segundo
formante de un área de frecuencia formántica a otra. La misma autora muestra este punto
con diferentes espectrogramas. Veamos los siguientes donde comparamos un hiato con
un diptongo:
46
Figura 5. Secuencia [a ´e] en lindes de palabra: hiato en estopa épico.
Aquí se observan claramente dos vocales en la forma de la onda y dos centros vocálicos
en el espectrograma. Aunque es difícil dividir la onda en segmentos que se correspondan
con las unidades fonéticas, “es posible separar dos vocales incluso en los casos de timbre
idéntico” (p. 365). En este último caso hay un descenso de amplitud en el paso de una
vocal a otra.
47
Figura 6. Secuencia [‘ta ek] en lindes de palabras: diptongo en tacatá ecológico.
En este caso de diptongo, una zona estable desaparece y observamos una transición
continua del segundo formante cambiando de frecuencias formánticas. La autora agrega
que la diferencia entre una deslizada alta y una no alta reside en la localización de las
frecuencias, pero no en el tipo de movimiento. Entonces, si comparamos el
espectrograma previo (diptongo con deslizada media) y el siguiente (diptongo con
deslizada alta), se puede ver esto más claramente:
48
Figura 7. Secuencia [‘ta ik] en lindes de palabras: diptongo en patata iqueña.
En el caso de diptongo con deslizada alta, el segundo formante de la vocal [a] muestra
frecuencias superiores a las que generalmente se observan, y el segundo formante de [i]
se presenta en áreas frecuenciales inferiores a las habituales.
Chitoran (2002) estudió las deslizadas en rumano comparando dos diptongos ([ea], [oa])
y las dos secuencias deslizada-vocal ([ja], [wa]). Aunque todas estas secuencias pueden
describirse como diptongos, la autora las distingue con términos diferentes porque
argumenta que hay representaciones fonológicas diferentes para cada grupo. Condujo
experimentos de producción y percepción con el objeto de encontrar evidencia acústica y
perceptual que apoye las diferentes representaciones fonológicas que ella arguye para los
diptongos y las secuencias. Para el experimento de producción, cuatro nativo hablantes
leyeron tres veces una lista de palabras que incluía los diptongos y las secuencias de
interés. Se hicieron grabaciones de sus lecturas y se analizaron los datos obteniendo las
medidas en espectrogramas de banda ancha y oscilogramas, las cuales consistieron en la
49
duración total, la duración de la transición, la velocidad de transición, y valores de inicio
de F2.
Los resultados muestran que la secuencia [ja] fue significativamente más larga que [ea]
(p=.000 para los cuatro hablantes). La duración total de [wa] y [oa] es comparable para
todos los sujetos (p>.05). y en cuanto a la duración de la transición, se encontró que [ja]
fue significativamente más larga que [ea] para los cuatro hablantes (p=.000), mientras
que en los casos de [wa] y [oa] no se identificó ninguna diferencia estadísticamente
significativa (p>.05).
La secuencia [ja] mostró una velocidad de transición de F2 significativamente mayor que
la del diptongo [ea]. F2 tiene una curvatura más pronunciada en [ja] que en [ea], y
entonces la velocidad a la que el segundo formante baja es mayor en la secuencia de
deslizada-vocal. Un valor mayor indica una velocidad de transición más rápido. La
diferencia fue estadísticamente significativa para los cuatro hablantes (p=.000). Sin
embargo, la velocidad de transición para [wa] y [oa] fue comparable (p>.05). En cuanto a
los valores de inicio de F2, los resultados muestran diferencias entre [ja] y [ea] con un
inicio de F2 más alto para [j] que para [e] (p=.000). Los valores de inicio de F2 fueron
comparables para [wa] y [oa] en tres de los sujetos.
Con el experimento de percepción, Chitoran (2002) probó la habilidad de los hablantes de
percibir los diptongos y las secuencias. La autora reporta como hallazgos que la
secuencia [ja] y el diptongo [ea] fueron identificados correctamente con un nivel de
significancia de .05 (z=33). La secuencia [ja] fue identificada correctamente 89% de las
veces (z=39), y el diptongo [ea] 78% (z=28). Por otra parte, el test para [wa] [oa] arrojó
50
resultados diferentes. El número de respuestas correctas no es significativa en el nivel de
p=.05 level (z=3). La secuencia [wa] fue identificada correctamente 46% de las veces
(z=4), y el diptongo [oa] 48% (z=2). Con estas evidencias, Chitoran apoya un análisis
fonológico diferente para las secuencias deslizada-vocal [ja] y para los diptongos [ea], el
cual se discutirá en la siguiente sección. También, ofrece indicadores acústicos para
distinguir la secuencia [ja] y el diptongo [ea] en los cuales deslizadas altas y medias
intervienen. En su análisis no incluye los vocoides posteriores, dado que los resultados
obtenidos no fueron contundentes ni significativos y no ofrecen la evidencia necesaria
que apoyen su propuesta teórica.
Retomando la lengua española y la diptongación como estrategia para resolver hiatos,
tenemos que en este caso una de las vocales pierde silabicidad y emerge como deslizada.
Un fenómeno dialectal bien conocido en español es que las vocales medias en algún paso
del proceso cambian de timbre y emergen en estos contextos como deslizadas altas. Cury
Lambraño (2004), por ejemplo, cita más de cien palabras con diptongos derivados de
vocales medias que cambian su timbre: oa>ua , ea>ia, eo>io, ee>ie como característica
del habla costeña de Colombia. En el mismo sentido, pero atendiendo el español
mexicano, Moreno de Alba (1994) subraya que el fenómeno de diptongación de hiatos se
menciona desde los primeros estudios conocidos y que éste se atribuye a la pronunciación
del español de todos los mexicanos y no sólo de algunos de sus dialectos.
Hualde et al. (2008) argumentan que actualmente hay una neutralización entre los
fonemas vocálicos altos y medios, pues ambos se realizan como deslizadas altas en
secuencias VV formando diptongos. También señalan que hay mucha conciencia social
de este proceso entre los hablantes. En su estudio encontraron, sin embargo, que las
51
secuencias de vocales no altas en español muestran considerable variación en su
realización; ellos distinguieron dos principales estrategias de resolución: asimilación (o
elisión como algunos autores la llaman) ea>a; y disimilación (también la llaman
deslizamiento) ea>ja.
Garrido (2007) discute la resolución de secuencias vocálicas en el español colombiano y
cita como ejemplos los de Alonso (1930): acordeón >acordión, león > lion , toalla >
tualla. Señala que la diptongación es un fenómeno que ha caracterizado la evolución del
español, pues la tendencia general ha sido formar diptongos a partir de hiatos: Ital[i.a] 
Ital[ja]; Hispan[i.a]  Hispan[ja]. Incluso, hiatos que surgieron con la elisión de una
consonante intervocálica, también se diptongaron: regina  re.í.na  réi.na. Agrega que
esta tendencia a resolver hiatos puede darse alterando la calidad de una de las vocales
involucradas: petról[e.o]  petról[jo], o trasladando el acento a otra vocal /má.is/ >
/máis/. En su artículo, Garrido analizó la variación en la articulación de las secuencias IO
y EO, siendo las primeras pronunciadas como diptongos y las segundas como hiatos,
según las reglas. Comparó los datos de dos regiones dialectales del español de Colombia
(andino y caribeño), además de dos diferentes estilos.
En su estudio participaron diez hombres y siete mujeres, todos estudiantes universitarios
monolingües con edades entre 18 y 25 años. De ellos, ocho eran del dialecto andino, y
nueve, del caribeño. Realizaron dos tareas: en la primera, los informantes leyeron una
lista de palabras objetivo (con la secuencias de interés) incluidas en una misma frase
“Digo ______ para ti”. Las palabras objetivo contenían la secuencia /io/ pronunciada
como diptongo y la secuencia /eo/ pronunciada como hiato según las normas. Las
palabras se clasificaron según la posición del acento (pretónicas, tónicas y postónicas).
52
En la segunda tarea, los sujetos, con ayuda de unos dibujos, tenían que narrar una historia
usando las palabras que ellos veían representadas en los dibujos. La duración de los
segmentos y los valores formánticos (F1) fueron los correlatos acústicos seleccionados
para determinar si la secuencia se pronunciaba como hiato o diptongo y si había un
cambio en la calidad de la vocal, ya que a menor valor de F1 del primer elemento de la
secuencia, mayor grado de diptongación.
Los resultados muestran que en la tarea de lectura no hubo diferencia significativa en la
duración del diptongo [jo] en los dos grupos dialectales. Sin embargo, en cuanto a la
secuencia [eo], los hablantes andinos la pronuncian con una duración mayor. En cuanto a
los valores de F1, los hablantes andinos muestran valores más altos de F1 tanto en
posición pretónica como tónica, lo que indica que el primer elemento de la secuencia se
mantiene como vocal media. Los hablantes caribeños, por el contrario, pronunciaron la
/e/ con valores de F1 más bajos, lo que sugiere que en su articulación el primer elemento
es similar a la deslizada [j]. En posición tónica, los andinos muestran una mayor
diferencia entre [jo] y [eo]. Los resultados sugieren, como la autora declara, que aunque
ambos dialectos mantienen el contraste de calidad vocálica entre [j] y [e], la articulación
de los caribeños muestra una tendencia a la neutralización. Es decir, en el español
caribeño hay una tendencia mayor a diptongar las secuencias hiáticas (la diferencia de
duración entre [jo] y [eo] se neutraliza), mientras que los hablantes andinos tienden a
mantener el contraste entre diptongos e hiatos.
Con respecto a la tarea de narración, las secuencias vocálicas tuvieron una duración
menor en comparación con las de la lectura en ambos grupos dialectales, tal como se
esperaba de un contraste en estilo espontáneo (narración) versus formal (lectura). Esta
53
neutralización del contraste regional en esta tarea de narración indica, de acuerdo con la
autora, que el estilo es un factor restrictivo en la diptongación de secuencias vocálicas
media/baja. Esto se evidencia en la claridad de contraste hiato/diptongo que mantienen
los andinos en estilo formal o cuidadoso; no obstante, dicho contraste desaparece en
habla informal o espontánea.
Como se discutió en la sección sobre variación, estilo y dialecto, aquí una vez más se
muestra cómo los factores externos influyen en la producción de hiatos y diptongos. Lo
relevante para nuestro estudio es que los resultados de Hualde et al (2008) y Garrido
(2007) no son concluyentes respecto a la realización de una deslizada media o una alta.
Ya que la diptongación de hiatos parece ser un proceso continuo, establecer las
diferencias reales entre una deslizada media y una alta requiere de más investigación, tal
como lo sugirieron Hualde et al. En realidad, en muchos estudios cualitativos, se toma
por hecho la elevación de la vocal media al formar diptongos.
En un estudio de corte sociolingüístico, Vuskovich (2006) encontró que la formación de
deslizadas no altas es la estrategia más común de resolución de hiato en México. Él
argumenta que, como las vocales altas, las vocales medias pueden también perder su
silabicidad, “but do not typically become full glides in certain dialects”. Dado que el
análisis de los datos se hizo de manera impresionista, no ofreció indicadores acústicos
para apoyar su argumento.
54
2.4.3 Vocales y deslizadas desde una perspectiva fonológica
Crystal (1991) define las vocales como el centro de la sílaba. Sin embargo, no especifica
la posición ni función de las deslizadas en la sílaba. La distinción entre deslizadas y
vocales ha sido un tema abordado desde diferentes enfoques teóricos. Aquí presentamos
sucintamente algunos de los más relevantes en torno a esta distinción.
Sound Pattern of English
En el marco de la teoría de The Sound Pattern of English (Chomsky y Halle, 1968), las
vocales se distinguen de las deslizadas por el rasgo [± silábico]; es decir, las vocales son
[+silábico], y las deslizadas son [-silábico]. De esta manera, las vocales son el centro o la
cima de una sílaba mientras que las deslizadas se encuentran en la periferia. Esta
categorización conlleva así al concepto de sílaba, pero aquí la situación se torna
complicada, pues SPE no define lo que es una sílaba en detalle. Bajo esta perspectiva, se
asume que cada vocal corresponde a una sílaba. SPE deja muchas lagunas en este tema y
no se contestan preguntas relacionadas con la representación de los diptongos, las vocales
fusionadas, ni la alternancia deslizada/vocal.
Para Selkirk (1982), la sílaba se caracteriza por estar conformada por constituyentes
internos referidos como ataque, rima, cima y coda. Bajo este enfoque, los diptongos son
‘vocales complejas’ situadas en una cima ramificada que tiene dos nodos: débil y fuerte;
la deslizada se ubica bajo el nodo débil y la vocal bajo el nodo fuerte. Veamos esto más
claramente con el ejemplo siguiente del inglés:
55
Figura 8. Estructura silábica de Selkirk
Fonología CV
En el marco teórico de la fonología generativista, tenemos también esta otra vertiente no
lineal: la autosegmental (Clements y Keyser, 1983). La teoría autosegmental o fonología
CV no necesita el rasgo [silábico], pues la distinción entre [± silábico] está representada
en el nivel fundamental del esqueleto prosódico integrado por dos elementos primitivos:
C (no silábico) ó V (silábico). Como se observa abajo, la segunda parte del diptongo se
clasifica en esta teoría como una consonante. Las vocales derivadas se enlazan con dos
espacios correspondientes a C y a V, mientras que las vocales subyacentes se enlazan con
dos Vs. Esta flexibilidad resulta relevante para el fenómeno de hiato y formación de
diptongos. Veamos el ejemplo:
Figura 9. La sílaba en CV
56
Clements y Keyser proponen un nivel nuclear o fundamental que definen como una
categoría prosódica que consiste de secuencias tautosilábicas de V(X). Aquí hacen una
distinción entre diptongos crecientes (deslizada + vocal) y diptongos decrecientes (vocal
+ deslizada)5; y las sílabas se clasifican en ligeras o pesadas. Así, un diptongo creciente
ligero consiste de un núcleo (v), el cual tiene una vocal. Un diptongo decreciente pesado
tiene un núcleo con dos espacios asignados:
Figura 10. Diptongo e hiato en CV
Steriade (1982) y Selkirk (1984) agregan a esta teoría la noción de la escala jerárquica
universal de sonoridad (siguiendo Hooper, 1976 y Harris, 1982). Para Steriade, las
vocales altas [i] y [u] tienen un lugar propio en la jerarquía, pero éstas no se distinguen de
sus contrapartes deslizadas. Ésta es la jerarquía que propone:
Escala 10 9 8 7 6 5 4 3 2 1 .5
Segmentos a e,o i,u r l m,n s v,z,đ f,t b,d,g p,t,k
Figura 11. Escala universal de sonoridad
5
Como anteriormente se señaló, en la literatura hispana, se distingue entre semiconsonantes (cuando una
deslizada precede una vocal) y semivocales (cuando la deslizada sigue una vocal).
57
Selkirk, por su parte, propuso una Generalización de Sonoridad Secuencial, la cual
establece que:
In any syllable, there is a segment constituting a sonority peak that is

preceded and/or followed by a sequence of segments with progressively
decreasing sonority values. (Selkirk, 1984:116)
Esta noción resulta relevante porque permea las subsecuentes propuestas teóricas con
respecto a la sílaba, y será abordada en la siguiente sección.
La teoría X
Esta teoría, representada por Levin (1985), propone una teoría de la silabificación basada
en la estructura de un esqueleto gradado compuesto por espacios vacíos denotados por Xs
en lugar de Cs y Vs. El núcleo en esta estructura es la que determina la silabicidad. Por lo
tanto, tampoco hay necesidad de un rasgo [silábico]. El siguiente es un ejemplo de su
propuesta, con un núcleo (N) y sus proyecciones (N’ y N’’):
Figura 12. La sílaba en la teoría X
58
Resulta interesante que el diptongo decreciente se representa en un núcleo ramificado con
dos espacios X, mientras que la deslizada en el diptongo creciente comparte el espacio
con la consonante como si ambas fueran parte del ataque.
La teoría moraica
Hyman (1985) argumenta a favor de una estructura gradada compuesta por “unidades de
peso”, lo cual se corresponde con la noción de ‘mora’. Propone que el nivel de duración
debe ser reinterpretado de manera que represente el peso fonológico. De esta manera, las
vocales largas y los diptongos decrecientes se asocian con dos moras, mientras que las
vocales cortas y los diptongos crecientes se asocian con una mora. Ver ejemplo abajo 6:
Figura 13. La sílaba en la teoría moraica
Aunque en general se habla de deslizadas involucrando vocoides altos, en rumano
encontramos diptongos con vocales medias. Utilizando el marco de la teoría moraica,
Chitoran (2001) distingue los diptongos ([ea], [oa]) de las secuencias deslizada-vocal
6
μ representa una mora.
59
([ja], [wa]) en rumano y propone una representación fonológica diferente para cada
grupo. Así, para los diptongos, sugiere:
Figura 14. Diptongo en rumano
Ambos elementos del diptongo los representa compartiendo un núcleo silábico, lo que
predice que los diptongos funcionan como una sola unidad y un solo segmento. Para las
secuencias de deslizada-vocal, propone la siguiente representación fonológica, donde
como puede observarse, aquí sólo la vocal pertenece al núcleo, mientras que la deslizada
forma parte del ataque.
Figura 15. Secuencia deslizada-vocal en rumano
Esta breve revisión de los diferentes análisis de la silabificación de las deslizadas y las
vocales nos muestra los diferentes cambios y perspectivas que ha habido en la teoría
fonológica en cuanto a su representación. La adición de nuevas nociones como la escala
de sonoridad, los constituyentes de la sílaba, el uso de moras o niveles gradados
autosegmentales han contribuido particularmente a una mejor categorización y
60
representación de ambos segmentos. El acento y la escala de sonoridad sobresalen entre
los factores que afectan la resolución de hiatos, por lo que dedicamos las siguientes
páginas a su discusión.
2.5 Sonoridad y resolución de hiatos
De acuerdo con Harris (1983), definir una sílaba resulta complejo y problemático, ya que
aún con la ayuda de los espectrogramas, no se puede extraer una sílaba. Así, para
aproximarse a la realidad física de una sílaba se recurre a la noción de escala de
sonoridad. Dicha sonoridad se especifica según una escala universal. Aunque ya referida
arriba, aquí incluimos nuevamente la propuesta por Steriade (1982) por cuestión de
claridad.
Escala 10 9 8 7 6 5 4 3 2 1 .5
Segmentos a e,o i,u r l m,n s v,z,đ f,t b,d,g p,t,k
Esta escala, sin embargo, puede adaptarse dependiendo de la lengua en cuestión. Para
español, Núñez Cedeño y Morales-Front (1998: 170) sugieren la siguiente escala:
1. Vocales
2. Deslizadas
3. Líquidas
4. Nasales
5. Obstruyentes
61
Hualde (2005) propone la siguiente escala:
6 vocal baja a
5 vocales medias e, o
4 vocales altas i, u
3 líquidas l, (ʎ) r, ɾ
2 nasales m n ɲ
1 obstruyentes f β ð ɣ s x ʝ ʧ
Figura 16. Escala de sonoridad en español
Para Hualde (2005), las deslizadas pueden ser altas o medias y se ubican en los mismos
niveles que las vocales subyacentes correspondientes. Aunque en general estas escalas se
aceptan, todavía no hay una respuesta completa ni clara a la pregunta de qué es
sonoridad. Ladefoged (1993) define la sonoridad de un sonido como “[…] its loudness
relative to that of other sounds with the same length, stress, and pitch”. Parker (2002)
tuvo como objetivo identificar correlatos físicos cuantificables con la sonoridad
fonológica. Midió los correlatos de sonoridad en inglés y en español y encontró que la
intensidad es el más confiable mientras que la duración es el correlato más débil.
Jany et al. (2007) examinaron la universalidad de la base acústica para la jerarquía de
sonoridad en árabe egipcio, hindi, mongol y malayalam considerando la base acústica en
términos de intensidad. Concluyeron que excepto por el mongol, la siguiente escala
universal de sonoridad se mantiene: deslizadas > líquidas > nasales > obstruyentes. Las
vocales, asumimos, están al inicio de la escala antes de las deslizadas.
62
Jany et al (2007) argumentan que, basándose en la estructura interna de la sílaba, se
pueden encontrar evidencias fonológicas para la jerarquía de sonoridad a través del
Principio Secuencial de Sonoridad (Blevins, 1995; Clements, 1990; Harris, 1983), el
Mínimo de Distancia de Sonoridad (Selkrik, 1984; Steriade, 1982), del Principio de
Dispersión de Sonoridad (Clements, 1990, 1992), y el acento basado en sonoridad
(Bianco, 1996; de Lacy 1997, 2002).
En breve, el Principio Secuencial de Sonoridad establece que el núcleo silábico
constituye una cima de sonoridad, la cual es precedida o seguida por segmentos con
valores progresivamente decrecientes, determinados por la jerarquía de sonoridad. Esta
definición se corresponde con la Generalización de Sonoridad Secuencial de Selkirk
(1984). De acuerdo con Morelli (1999), esta idea la introdujeron mucho antes Sievers
(1881), Jespersen (1904), Sausurre (1914) y Grammont (1933). Más recientemente,
Hooper (1976), Kiparsky (1979), Steriade (1982), Selkirk (1984) y Clements (1990) han
contribuido a este principio.
El Principio de Mínimo de Distancia de Sonoridad fue introducido por Harris (1983) y
establece que los segmentos se combinan en base a su relativa distancia en la escala de
sonoridad. Algunas lenguas pueden requerir una distancia menor o mayor entre un sonido
y los sonidos adyacentes. Este principio complementa en algunas lenguas el Principio
Secuencial de Sonoridad.
Para Clements (1990), hay dispersión de sonoridad en la sílaba cuando la máxima
sonoridad recae en la demisílaba inicial (ataque) y la mínima sonoridad se localiza en la
demisílaba final (coda); es decir, la combinación preferida es aquélla que implica un claro
63
y constante incremento de sonoridad en el ataque y un mínimo decremento en la coda
(con la secuencia CV sin decremento, por supuesto).
Clements (2005:5) menciona estos otros principios de silabificación basados en
sonoridad:
Alineación sonoridad-silabicidad: la cima de sonoridad se corresponde con las
cima de la sílaba y vice-versa.
Contacto silábico: la sonoridad baja a su nivel máximo a través de los lindes
silábicos.
Retomando el tema de hiato en español, se observa que la secuencia de vocales puede ser
de sonoridad creciente, sonoridad decreciente y sonoridad constante (sound plateau en
inglés). Con sonoridad creciente, la V1 tiene un nivel menor de sonoridad que la V2,
según lo dicta la escala de sonoridad; con la sonoridad decreciente, la V2 es menor en la
escala de sonoridad que la V1; y con la sonoridad constante, ambas vocales comparten el
mismo nivel de sonoridad. Veamos estas secuencias hiáticas ilustradas junto con
secuencias diptongadas en las mismas o similares palabras para observar que la misma
sonoridad creciente o decreciente permanece cuando se resuelve el hiato:
Sonoridad creciente
Hiato: frío [fɾí.o] María [ma.ɾí.a] Gúa [gú.a]
perpetúa [peɾ.pe.tú.a] almohada [al.mo.áða] teatro [te.á.tɾo]
64
Diptongo: friolento [fɾjo.lén.to] Mariana [ma.ɾjá.na]
Guatemala [gwa.te.má.la] perpetuar [peɾ. pe.twáɾ]
[al.mo̯á.ða] [al.mwá. ða] teatro [te̯a.tɾo] o [tja. tɾo]
Sonoridad decreciente
Hiato: aúlla [a.ú.ʝa] país [pa.ís] oír [o.íɾ]
Diptongo: aullando [aw.ʝándo] paisano [paj.sá.no] oigo [ój. ɣo]
En español, los hiatos con secuencias que producen una sonoridad constante son también
comunes; sin embargo, cuando el hiato se resuelve (mediante otra estrategia que no sea
heterosilabificación), la sílaba resultante en muchos casos no produce la misma sonoridad
constante que la secuencia original; es decir, la sonoridad se altera para satisfacer los
principios de Sonoridad Secuencial y de Dispersión de Sonoridad. Los siguientes
ejemplos ilustran esto:
Sonoridad constante
Hiato: poseer [po.se.éɾ] alcohol [al.ko.ól]
azahar [a.sa.áɾ] moho [mó.o]
pateé [pa.te.é] acordeón [a.koɾ. ðe.ón] poeta [po.e.ta]
Elisión: poseer [po.séɾ] alcohol [al.kól] azahar [a.sáɾ]
moho [mó] pateé [pa.té]
65
Diptongación con deslizadas medias o altas:
pateé [pa.tjé] acordeón [a.koɾ. ðe̯ón] o [a.koɾ. ðjón]
poeta [po̯e.ta] o [pwe.ta]
Epéntesis consonántica:
moho [mo.xo]
Con los ejemplos de arriba, particularmente con las secuencias de vocales medias en
contacto, puede refutarse este argumento de cambio de sonoridad dependiendo de la
escala jerárquica de sonoridad propuesta. Si nos basamos en la de Hualde (2005), pues no
hay cambio de sonoridad dado que las deslizadas se ubican en la misma escala que las
vocales subyacentes. Sin embargo, para Núñez Cedeño y Morales-Front (1998) las
deslizadas en español están un nivel debajo de las vocales, lo que coincide también con la
escala de Jany et al (2007), y esto apoya el cambio de sonoridad que sugerimos aquí.
Además del cambio de nivel de sonoridad, en las sílabas resultantes se obedecen los
principios de Sonoridad Secuencial y el de Dispersión de Sonoridad.
No obstante lo anterior, esto no implica que la selección de una u otra estrategia sea
arbitraria. Como arriba se ejemplificó, algunas palabras se resuelven generalmente con
sólo una estrategia, mientras otras se resuelven de diferentes maneras. Esto es
precisamente lo que conlleva a la variación existente. La pregunta entonces es cuándo se
prefiere una estrategia a otras. Bakovic (2007), al respecto, señala que un factor que
influye en la selección de una u otra estrategia en la resolución de hiato es el rechazo a
elementos idénticos adyacentes, pues estos elementos idénticos con frecuencia se evitan o
reparan por medio de diferentes procesos fonológicos (McCarthy 1986, Borowsky 1987,
66
Yip 1988 citado por Bakovic). Como se puede observar en los ejemplos de arriba, estos
procesos pueden ser elisión, diptongación o epéntesis consonántica.
En cuanto a elisión, Martínez-Gil (2000), en su análisis de secuencias vocálicas en lindes
de palabras en el español chicano, afirma que las vocales idénticas se contraen en una.
En consonancia con esto, Jenkins (1999) encontró que los grupos vocálicos idénticos en
lindes postléxicos se fusionan en una sola vocal, y él llama a este proceso fusión. Su
explicación del proceso la fundamenta en la “Twin Sister Convention” (Clements and
Kaiser, 1983), la cual prohíbe valores de rasgos idénticos adyacentes en una unidad que
soporta un solo rasgo; es decir, ‘las hermanas gemelas’ se degeminan simplificando así la
secuencia de dos vocales en una. El Principio de Contorno Obligatorio también se utiliza
en la explicación, ya que éste indica que los elementos idénticos adyacentes no pueden
coexistir en el output.
Otra explicación frecuentemente considerada para la elisión de segmentos se basa en el
principio del menor esfuerzo, el cual implica el mínimo esfuerzo articulatorio necesario
para mantener la inteligibilidad (Véase Kirchner,1998; 2001; 2004). Kirchner (1998)
señala que el principio fonético del mínimos esfuerzo puede expresarse formalmente en
el marco de la Teoría de la Optimidad como una restricción universal, la cual puede ser
violada en algunas lenguas por los conflictos entre las restricciones que se presenten. Este
autor propone particularmente que el proceso de lenición (la elisión incluida aquí como el
proceso extremo) está motivado por un imperativo fonético: el mínimo esfuerzo
articulatorio.
67
Mientras que las explicaciones de Jenkins y Martínez-Gil abordan el hiato en el nivel
postléxico, la presente disertación se concentra en secuencias a nivel léxico y por ello el
tipo de palabra en cuestión es crucial. Tomando como base la noción de sonoridad,
nuestra hipótesis es que se preferirá la elisión a otras estrategias cuando el hiato esté
compuesto de dos vocales idénticas en el nivel léxico. Sin embargo, cuando este grupo
vocálico es el resultado de procesos morfológicos como conjugación o derivación, existe
la posibilidad de escoger diptongación con deslizada media o deslizada alta. Esto
significa, en consecuencia, que no todas las palabras que incluyan una secuencia de
vocales idénticas resolverán el hiato por medio de elisión; hay un grupo de palabras
derivadas que están morfológicamente relacionadas las cuales usan diptongación y, por
analogía, resuelven el hiato con esta estrategia. La variación que observamos es el caso
de las formas verbales como pateé [pa.te.é], la cual tiene una secuencia de vocales
idénticas, producto de conjugación, pues es el tiempo pasado del verbo patear para la
primera persona de singular:
Verbo: patear
Base: pate-
Tiempo pasado primera persona singular: é
Nuestra hipótesis es que algunos hablantes que resuelven el hiato en este tipo de verbos
con elisión lo hacen siguiendo reglas del Principio Secuencial de Sonoridad, la
Convención de Hermanas Gemelas y el principio del menor esfuerzo. Lo que consideran
para resolver el hiato de esta manera es solamente el marco donde dos vocales idénticas
coinciden. Es decir, estos hablantes se constriñen solamente por reglas fonológicas, por la
68
estructura compuesta de dos vocales similares, justo como hacen con otras palabras
donde se observa el mismo patrón: alcohol, poseer, leer, etc.
Sin embargo, hay otros hablantes que usan la diptongación con deslizada media o alta en
lugar de elisión para resolver el hiato. Esta preferencia, sugerimos, se basa en principios
fonológicos y relaciones morfológicas con palabras similares cuyas secuencias vocálicas
también se diptongan o integran diptongos derivados. Lo que parece ocurrir es que
‘pateé’ es una palabra paradigmáticamente relacionada con el verbo ‘patear’, y los
hablantes que resuelven el verbo en infinitivo u otras formas conjugadas con
diptongación, harán lo mismo con ‘pateé’ por analogía. Al hacerlo, mantienen todas las
vocales o espacios de vocoides -aunque la V1 se vuelve deslizada alta- y respetan los
principios de sonoridad y del mínimo esfuerzo. Incluso, parece ser que en verbos no
necesariamente –ear, pero que incluyen la secuencia vocálica e + vocal en sus formas,
también pueden presentarse estos diptongos. Por ejemplo, con formas como “veamos”,
“leamos”, etc., también es probable que surjan diptongos con media y con alta, aunque
con ésta última estas producciones se asocian generalmente con gente de nivel educativo
muy bajo o de áreas rurales.
La selección entre hacer la V1 una deslizada media o alta parece depender de la escala de
sonoridad y el Principio de mínimo de distancia de sonoridad. Aquellos hablantes que
prefieran una distancia mayor entre un sonido y el sonido adyacente en la escala de
sonoridad diptongarán con una deslizada alta; y aquellos hablantes que escojan una
menor distancia entre los sonidos involucrados en la secuencia seleccionarán la deslizada
media. Por ejemplo, consideremos el infinitivo ‘patear’. El resultado después de resolver
el hiato con diptongación puede ser [pa.te̯aɾ] o [pa.tjaɾ]; la primera secuencia tiene
69
solamente un nivel o grado de diferencia en la escala de sonoridad, mientras que el
segundo resultado presenta dos niveles de diferencia. Esta variación con este fenómeno
puede encontrar explicaciones en bases sociales. Esta relación o efecto de los factores
sociales en el uso de una u otra estrategia se analizará en el capítulo cuatro.
La epéntesis consonántica también se usa en la resolución de hiatos cuando la preferencia
es mantener sílabas atendiendo los principios de Sonoridad Secuencial y de Dispersión de
Sonoridad. El ejemplo ofrecido aquí es ‘moho’ en el que se inserta la consonante [x]
entre las vocales. Esto se ha escuchado en la Península de Yucatán, pero no es común. La
estrategia más empleada es la elisión. Esto puede explicarse en términos del principio del
menor esfuerzo, pues ambas estrategias, elisión y epéntesis consonántica, respetan los
principios de sonoridad; o en términos de variación basada en otros factores lingüísticos o
sociales. Los factores sociales, precisamente, pueden explicar también otros casos de
resolución de hiato. Discutiremos esto en el capítulo tres. A continuación, abordaremos el
acento, otro tema interno crucial en el fenómeno de la resolución de hiatos.
2.6 Acento y resolución de hiato
De acuerdo con Hualde (2005: 220), “[…] stress is the degree of relative prominence that
a syllable receives in comparison with the other syllables in a given domain.” Agrega que
en el dominio de la palabra, sólo una sílaba puede recibir acento primario. Considerando
algunos correlatos fonéticos del acento, Contreras (1964) (citado por Montero, 2007)
condujo experimentos examinando la duración, intensidad y ‘pitch’ o ƒ0 (frecuencia
fundamental) del acento en español y concluyó que el ‘pitch’ es el correlato más
importante. Solé Sabater (1985) coincide con Contreras en que el ‘pitch’ es el correlato
70
más importante del acento, seguido de duración. La intensidad parece no desempeñar un
papel relevante. Por su parte, Llisterri et al. (2004) concuerdan también en que ƒ0
(frecuencia fundamental) es el correlato más decisivo en la percepción del acento.
Montero (2007) en su estudio sobre la percepción de los correlatos acústicos del acento
en inglés, francés y español, encontró que ƒ0 es el mejor indicador, seguido de intensidad
y después de la duración. Finalmente, Cabré y Prieto (2007) afirman que las secuencias
acentuadas son las más largas en todas las lenguas.
En español, el acento es fonológicamente contrastivo; es decir, que tiene una función
distintiva, pues palabras idénticas pueden recibir el acento en diferente posición y
conllevar así significados diferentes, tal como ocurre en público, publico y publicó, que
siendo la misma palabra, la primera recibe el acento en la tercera sílaba, la segunda en la
segunda, y la tercera en la última sílaba y sus significados son distintos. Esta posibilidad
del acento de cambiar de posición, sin embargo, no es totalmente libre; ésta está limitada
a las últimas tres sílabas de la palabra (a lo que Harris, 1983 llamó la ventana silábica).
Así, dependiendo de la posición del acento en cualquiera de estas tres últimas sílabas, las
palabras se clasifican en oxítonas, cuando la última sílaba es la acentuada; paroxítonas,
cuando la penúltima es la tónica; y proparoxítonas, cuando la antepenúltima recibe el
acento. Veamos los siguientes ejemplos:
Oxítonas
[le.ón] [pa.ís] [bol. βéɾ]
Paroxítonas
[rí.o] [lé.o] [bú.o]
71
Proparoxítonas7
[a.é.re.o] [te.lé.fo.no] [mo.men.tá.ne.o]
No obstante esta generalización, Ohanessian (2004) y Hualde (2005) afirman que la
asignación del acento es diferente cuando se trata de verbos o adjetivos. Dado que
nuestro interés en este estudio son las conjugaciones de los verbos –ear y éstas no
presentan variaciones o irregularidades en la asignación del acento, no ahondaremos en
las distinciones mencionadas.
2.6.1 La función del acento en la resolución de hiato
En estudios recientes sobre la lengua española, se ha identificado el acento como uno de
los factores más determinantes en la resolución del hiato (Ver Sanicky, 1989; Jenkins,
1999; Aguilar, 1999, 2006; Alba, 2005, 2006; Morris, 1998; y Martínez-Gil, 2000).
Senturia (1998) sostiene que ‘hiatus appears when a sequence of two vocoids rising or
falling in sonority is stressed on the less sonorous vocoid, or when the vocoid sequence is
of equal sonority’ (p 182). Asimismo, Rosenthall (1994) considera el acento como un
factor crucial en la formación de hiato, pues señala que un vocoide alto acentuado
conforma un hiato cuando aparece adyacente a una vocal no alta, pero un vocoide alto
átono es tautosilábico con la vocal adyacente. En algunos dialectos, sin embargo, esta
afirmación no puede sostenerse.
7
En español mexicano, aéreo y momentáneo se pronuncian generalmente como paroxítonas, diptongando la secuencia
[e.o]. Resulta interesante observar que estas palabras mantienen una marca ortográfica del acento siguiendo la regla que
declara que todas las palabras proparoxítonas deben ser tildadas ortográficamente, lo cual significa que dichas
secuencias deben silabificarse como heterosilábicas de acuerdo con la pronunciación prescrita.
72
Chitoran y Hualde (2007) y Face y Alvord (2004) llaman ‘hiatos excepcionales’ a las
secuencias de vocal alta átona contigua a otra vocal [iV] pronunciadas en sílabas
diferentes, aunque reconocen que la tendencia, tal como lo prescribe la gramática
tradicional, es a formar diptongo [jV]. Por ejemplo, ‘piano’ puede pronunciarse como
[pja.no] o [pi.a.no] en español peninsular. El último es un hiato excepcional y esta
variación se observa solamente cuando el vocoide alto es átono.
Aguilar (2006) también encontró que el acento desempeña una función primordial para
resolver hiatos. Considerando las estrategias de heterosilabificación o hiato como ella le
llama, diptongación (ella dice reducción) y elisión, encontró diferencias para la secuencia
/a e/ de acuerdo al patrón acentual en cuestión. En su estudio de hiato en el nivel
postléxico en español peninsular, Aguilar encontró que dos vocales átonas adyacentes
favorecen la elisión (45%), pero si V1 es tónica y V2 es átona, se prefiere la diptongación
(49%); y si V1 es átona y V2 es tónica, o ambas son tónicas, entonces la tendencia es
producir hiatos (87% y 91%, respectivamente).
Similarmente, Alba (2006), considerando los cuatro posibles patrones acentuales en una
secuencia vocálica entre palabras en el español de Nuevo México, encontró que el
contexto que favorece la resolución de hiato (que no sea el mantenimiento del mismo) es
aquél en el que ambas vocales son átonas (83%). Por el contrario, cuando las dos vocales
reciben acento, el hiato se resuelve sólo 13% de las veces. Cuando al menos una de las
dos vocales es átona, el hiato se mantiene 50% de las veces.
Un fenómeno interesante relacionado con acento y resolución de hiato es la dislocación
acentual. Mientras que Jenkins (1999) encontró en su estudio del español de Nuevo
73
México que los elementos acentuados nunca se alteran en la resolución a nivel de lindes
de palabras a menos que estén adyacentes a otro elemento tónico, Martínez-Gil (2000)
afirma que en español chicano siempre es la V1 (excepto /a/) la que se vuelve deslizada
junto a otra vocal. Esto implica que debe perder su silabicidad y el acento debe dislocarse
a la V2. Por ejemplo, Pasé horas  [pa.sjó. ɾas]. Comparando con el español mexicano,
el autor señala que en éste la tendencia es también a hacer la V1 una deslizada, sin
embargo, esto ocurre sólo cuando la vocal es átona; es decir, las vocales tónicas tienden a
mantener siempre su carácter nuclear. No obstante, Hualde (1995) ofrece algunos
ejemplos de cambio acentual en México: ma.íz  [májs]; ma.estro  [májs.tro].
Finalmente, en español peninsular, el autor destaca que la pérdida de silabicidad está
determinada principalmente por la sonoridad de los elementos implicados: la vocal
menos sonora según la escala de sonoridad será la más proclive a perder silabicidad sin
importar su posición en la secuencia y el acento se trasladará a la más sonora.
Con esta breve revisión del acento, podemos notar que indudablemente éste desempeña
un papel fundamental en la resolución de hiatos, pero no solamente eso, pues en realidad
el acento parece ser uno de los factores determinantes de la variación observada en la
resolución de hiatos en los diferentes dialectos del español.
Hasta aquí se ha presentado una revisión de la literatura de los estudios más relevantes y
recientes sobre la resolución de hiato, poniendo especial énfasis en los trabajos realizados
sobre el español y se discutió la variación observada. Por el creciente número de
investigaciones en la pasada década y actualmente, es notorio el interés en este tema
desde diferentes enfoques y perspectivas. Sin embargo, los estudios descriptivos son
indudablemente más abundantes, aunque los estudios experimentales han empezado a
74
hacer presencia en el mundo académico. Adicionalmente, en este capítulo se definieron y
describieron algunos conceptos, nociones y propuestas teóricas indispensables; se
presentaron algunas clasificaciones de estrategias de resolución y se abordaron los
factores internos y externos identificados en la literatura con la finalidad de contar con los
elementos teóricos suficientes para la discusión y análisis del fenómeno de la resolución
de hiatos en español en el capítulo cuatro.
Este apartado ofrece así una visión general de los avances y alcances de la investigación
sobre la resolución de hiatos en español, lo que nos ha permitido al mismo tiempo definir
hipótesis y perfilar la metodología de esta tesis: una combinación de teoría y metodología
variacionista y un enfoque fonético experimental. Dedicamos, por tanto, el siguiente
capítulo a presentar y discutir con detalle la metodología a seguir en esta tesis.
75
Capítulo 3: Método, variables e hipótesis
3.1 Teoría de la variación y metodología variacionista
En la investigación sociolingüística se observan generalmente dos enfoques: la
investigación cualitativa (etnografía de la comunicación, análisis del discurso) y la
investigación cuantitativa (variación y cambio lingüístico). La investigación
variacionista, con William Labov como su pionero, surge como un paradigma
cuantitativo dentro de la sociolingüística. Este tipo de investigaciones refuta el axioma de
categoricidad (Chambers, 2003), el cual asume que la estructura lingüística debe tratarse
como invariable. De ahí se deriva el principio de Weinreich, Labov, and Herzog (1968)
de que todos los sistemas lingüísticos muestran variación y que ésta es una propiedad
esencial que cubre funciones sociales importantes y permite un cambio lingüístico
ordenado. Para los variacionistas, por tanto, la variación es la parte central de la
investigación. La principal presuposición de los variacionistas es que la variación es
estructurada y, por tanto, se intenta descubrir los patrones que sigue dicha variación.
Weinreich et al., (1968:100) se refieren a esta noción como “heterogeneidad ordenada”, y
significa que la variación que observamos no es libre o azarosa, sino que sigue
determinados patrones. La tarea del variacionista es descubrir los patrones y
características de este sistema complejo. .
76
Por otra parte, el enfoque variacionista surge en contra de la dicotomía saussuriana que
separa los estudios sincrónicos de los estudios diacrónicos del cambio lingüístico. De
hecho, Tagliamonte (2006) sugiere que la mayor motivación para el desarrollo de este
enfoque era presentar un modelo de la lengua que pudiera acomodar las paradojas del
cambio lingüístico. Es sabido por todos que las lenguas están en constante cambio. Si
aceptamos la afirmación de Weinreich et al (1968) de que “no toda variación y
heterogeneidad involucra un cambio, pero que todo cambio involucra variación y
heterogeniedad”8, estudiar la variación lingüística nos llevaría a descubrir los cambios
incipientes, en curso o concluidos que se dan o se han dado en una lengua, integrando
estudios sincrónicos y diacrónicos.
Los análisis variacionistas toman como punto de partida la estructura lingüística de una
determinada lengua y estudian su realidad de uso en el contexto social atendiendo
factores sociales e internos de la lengua. La tarea de los variacionistas es esencialmente el
estudio de la relación entre variación, significado social y la evolución y desarrollo del
mismo sistema (cfr. Tagliamonte, 2006). La intención es determinar las constricciones
lingüísticas y los factores sociales que ejercen un efecto en el comportamiento lingüístico
de los hablantes. La edad, el sexo y la clase social son algunos de los principales factores
sociales incluidos en estudios variacionistas. Éstos varían dependiendo del contexto
social de los hablantes en cuestión.
Otra característica particular de los estudios variacionistas es que, al igual que todo
estudio sociolingüístico, la recolección de datos se basa, siguiendo a Johnstone (2000), en
8
Traducción propia.
77
observaciones de las personas usando la lengua, y en el análisis de esas observaciones. Es
decir, se considera que para analizar el comportamiento lingüístico debemos basarnos en
datos empíricos, a través de la observación del uso real de la lengua, y no en datos
construidos a partir de la introspección o de la especulación. El objetivo de la
metodología variacionista es accesar a la lengua vernácula de los sujetos, entendiéndose
ésta, según Labov (1972b: 208) como “the style in which the minimum attention is given
to the monitoring of speech”. Chambers (2003) se refiere a ésta como “estilo casual”; y
Milroy (1992), como “lengua real en uso”.
Dado que nuestro objetivo es analizar el fenómeno de la resolución de hiato en los verbos
–ear del español mexicano, hacerlo desde una perspectiva teórica y metodológicamente
variacionista parece ser el camino idóneo para alcanzarlo, pues la integración en el
análisis de factores lingüísticos y sociales nos permitirá tener una visión integral y
completa del fenómeno. Ésta es precisamente una limitante de trabajos previos que no
han mantenido un balance entre lo meramente estructural y lo social.
Cabe aclarar, no obstante, que una limitante de usar la metodología variacionista es que la
búsqueda de la lengua vernácula y de los datos de interés implica mucho tiempo y en
muchas ocasiones el número de ocurrencias o frecuencias de los datos en cuestión resulta
insuficiente para un análisis estadístico9. Por tanto, para salvar este obstáculo, para este
estudio decidimos conjuntar la teoría y metodología variacionista con un método fonético
experimental, el cual presentamos a continuación.
9
En un estudio piloto que realicé utilizando sólo la entrevista sociolingüística, el número de frecuencias fue
insuficiente para el análisis cuantitativo.
78
3.2 Método experimental
Con el propósito de contar con suficientes datos confiables que nos ayuden a comprobar
nuestras hipótesis y a ofrecer un análisis más objetivo y preciso del fenómeno de la
resolución de hiatos en los verbos –ear en español mexicano, se optó por una
complementariedad de metodologías: la variacionista, por un lado, y por el otro, un
enfoque experimental. Éste último es frecuentemente empleado en estudios fonéticos, los
que se distinguen de los tradicionales por el uso de instrumentos de laboratorio y por un
diseño de investigación experimental. Sampieri et al (2006) señala que “los experimentos
manipulan tratamientos, estímulos, influencias o intervenciones […] para observar sus
efectos sobre otras variables […] en una situación de control” (p. 160). De esta manera,
las pruebas o tareas en estudios fonéticos se vuelven una situación de control donde se
manipulan intencionalmente una o más variables independientes. Los paquetes de
software para manipulación de sonidos y análisis acústicos, así como el equipo de
grabación y otros instrumentos de laboratorio fonético se han constituido como
herramientas indispensables para el diseño de los experimentos y el análisis de los datos.
Recientemente ha habido un creciente interés y desarrollo de investigaciones en el campo
de la fonética experimental. En el caso concreto de estudios sobre secuencias vocálicas,
Aguilar, 1999; Hualde y Prieto, 2002; Face y Alvord, 2004; Aguilar, 2005 y 2006;
Garrido, 2007; Hualde y Chitoran, 2007; Hualde et al., 2008, han contribuido a la
discusión ofreciendo resultados confiables y descripciones más precisas bajo un método
fonético experimental. Partiendo de esta combinación de metodologías, planteamos el
presente trabajo como un estudio sociofonético de la resolución de hiato en los verbos ear
79
del español mexicano, en el que se presenta la intersección de la sociolingüística
variacionista con la fonética experimental.
En la sección de instrumentos y procedimientos que se presenta posteriormente se
describen las pruebas que se usaron en esta investigación, así como la entrevista
sociolingüística. También se discute su implementación y formas de análisis.
3.3 Definición de variables
3.3.1 Variable lingüística dependiente y sus variantes
A través de la experiencia con la comunidad de habla en Chetumal, México (nuestra
población de interés), hemos identificado variación en la producción del grupo vocálico
de los verbos –ear en sus formas verbales finitas y no finitas. Aunque las estrategias de
resolución reportadas en la literatura sobre el español pueden ser muy diversas, este
estudio se enfocará en: mantenimiento del hiato, formación de diptongo con deslizada
media [], formación de diptongo con deslizada alta [j], y elisión, dada la experiencia en
la comunidad de habla y las intuiciones propias que se tienen sobre este dialecto. De
manera gráfica tenemos lo siguiente:
Variable lingüística dependiente /e V10/
Variantes eV  V jV V
Figura 17. La variable linguística y sus variantes
10
V representa aquí cualquier vocal
80
3.3.2 Las variables lingüísticas independientes
De acuerdo con la literatura en torno a la resolución de hiatos, la estructura silábica, el
acento, y las deslizadas, se han identificado los siguientes factores internos que pueden
condicionar la variación existente de nuestra variable: e + V en verbos -ear.
Calidad de la vocal siguiente
En el grupo e + V, tenemos que la vocal siguiente en las formas verbales finitas y no
finitas puede ser solamente [a], [e], [o]. En la literatura se sugiere, por ejemplo, que
cuando tenemos dos vocales idénticas, una se elide. Nuestra propuesta es que ésta no es
la tendencia general en el caso de los verbos -ear, sino que los hablantes recurren más a
la estrategia de diptongación.
El acento
Acento en relación con la V1 o V2 o con la vocal de otra sílaba (VSS)11
En las conjugaciones de los verbos –ear identificamos tres patrones acentuales: la V1 es
tónica y la V2 es átona; la V2 es tónica y la V1 es átona; o ambas son átonas y el acento
recae en otra sílaba. Por ejemplo, en presente de primera persona [pa.sé.o] la V1 recibe el
acento prosódico; en pretérito de tercera persona [pa.se.ó] la V2 es la acentuada; y en las
formas de futuro [pa.se.a.ré], ninguna recibe el acento prosódico.
En concordancia con estudios previos, nuestra hipótesis es que el acento es la principal
condicionante lingüística que favorece el mantenimiento del hiato, puesto que las vocales
que reciben acento son más resistentes a los cambios. En contraste, en el caso que el
11
Vocal de la sílaba siguiente.
81
acento recae en una sílaba que no es la del grupo vocálico que conforma el hiato, como
en la mayoría de las formas de futuro [pa.se.a.ré], [pa.se.a.rás], [pa.se.a rá],
[pa.se.a.ré.mos] [pa.se.a.rán], hay una gran probabilidad de formación de diptongos. Una
hipótesis complementaria es que la traslación o dislocación acentual en español mexicano
no es favorecida, y esto inhibe también la formación de diptongos.
Sonoridad de las vocales en contacto
En el caso específico de las formas finitas y no finitas de los verbos –ear, tenemos
ejemplos de sonoridad creciente y de sonoridad constante (sound plateu en inglés). Así,
en [ba.té.a] y [ba.te.a.rá] tenemos sonoridad creciente dado que la [e] es de menor
sonoridad, según la escala de sonoridad, que la [a]. Por otra parte, en [ba.té.o],[ [ba.te.ó] y
[ba.té.e] tenemos sonoridad constante pues las vocales medias comparten el mismo grado
de sonoridad. Sin embargo, retomando la revisión de la literatura, tenemos que el
principio secuencial de sonoridad (Blevins, 1995; Clements, 1990; Harris, 1983), el
principio de mínimo de distancia de sonoridad (Selkrik, 1984; Steriade, 1982), y el
principio de dispersión de sonoridad (Clements, 1990, 1992) implican una estructura
silábica con sonoridad creciente. Asimismo, según Bakovic (2007), existe un rechazo a
elementos idénticos adyacentes, pues estos elementos idénticos con frecuencia se evitan o
reparan por medio de diferentes procesos fonológicos (McCarthy 1986, Borowsky 1987,
Yip 1988 citado por Bakovic). Por lo anterior, en español mexicano, es nuestra hipótesis,
hay una tendencia a evitar secuencias vocálicas con sonoridad constante; es decir, se
prefiere una secuencia vocálica cuyos elementos se distingan lo más posible en cuanto a
sonoridad.
82
Tipo de sílaba
Una de las condiciones de resolución de hiato identificada en la literatura es el tipo de
sílaba. Por ello, para este estudio también consideramos esta variable factor con sus dos
subfactores: sílaba abierta [pa.te.ó], o cerrada [pa.te.as.te]. La hipótesis con esta variable
es que las sílabas cerradas favorecen la resolución del hiato por medio de otra estrategia
que no sea la retención.
3.3.3 Variables externas independientes
Instrumento de recolección de datos
En este estudio se incluye la variable instrumento de recolección de datos en relación con
la distinción que estudios previos sobre resolución de hiato hacen del estilo, limitado por
algunos a la velocidad del habla y por otros a grados de formalidad en el habla, y que ha
sido una de las condicionantes más aludidas. Aquí utilizamos tres instrumentos de
recolección de datos: entrevista sociolingüística, prueba de transformación y prueba de
reconstrucción fonética. Con la primera, se presupone que la lengua de los informantes es
espontánea y con una velocidad más natural; con las pruebas, la producción del
informante es totalmente dirigida por lo que su monitoreo o grado de atención hacia la
lengua misma es mayor y su velocidad es menor. En una prueba el sujeto debe leer y en
la otra escuchar y repetir. Por ello, consideramos como variable el tipo de instrumento
usado y como subfactores la entrevista, la prueba de transformación y la prueba de
reconstrucción fonética.
83
Considerando que en la literatura se distinguen los hiatos generalmente de los diptongos
por su duración (los primeros con mayor duración que los últimos) y que se considera la
velocidad como una variable que afecta la producción de hiatos y diptongos; es decir, que
a mayor velocidad en el habla, mayor tendencia a producir diptongos, presuponemos que
la entrevista motivará mayor número de diptongos. No obstante, también se ha dicho que
la velocidad sólo provoca duraciones más breves para ambos hiatos y diptongos, pero no
una mayor producción de los últimos. Por otra parte, las pruebas, por tratarse de lectura
de enunciados o repetición del algo escuchado, probablemente arrojen palabras que
registren duraciones mayores tanto en hiatos o diptongos en comparación con la
entrevista, o que con un mayor monitoreo los informantes produzcan más hiatos.
Cualquiera que sea el caso, el instrumento puede ser un factor condicionante también de
la resolución de hiatos, como se ha visto también en estudios previos.
Edad
Si aceptamos la afirmación de Weinreich de que no toda variación involucra un cambio,
pero que todo cambio, generado por la comunidad de habla, involucra variación, estamos
obligados a identificar en primera instancia si se trata de un cambio. Para ello, un estudio
en tiempo aparente se vuelve indispensable. Es decir, agrupamos a los informantes por
edades diferentes y tratamos de ver si hay una distribución de la variable lingüística por
niveles de edad. Atendiendo los hallazgos recientes de Vuskovich (2006) en los que la
gente mayor produce más hiatos que los jóvenes, nuestra hipótesis es que estamos ante un
cambio en curso en el que los grupos más jóvenes favorecen la resolución del hiato con
estrategias diferentes a la heterosilabificación.
84
Para integrar los grupos etarios consideramos principalmente la relación edad y nivel
educativo que se da en México y lo observado en la comunidad de habla de interés, pues
generalmente la gente forma redes de contacto más cercanas con las personas de su
misma edad, ya sea de su nivel educativo o de su trabajo. Así, por ejemplo, un joven de
20 años va a relacionarse con otros universitarios si él es también estudiante, o con otros
jóvenes trabajadores de aproximadamente su misma edad si él ya ha incursionado en el
mundo laboral. Para esta investigación tenemos los siguientes cuatro grupos que
justificamos de la siguiente manera:
El primer grupo etario: 18-24 se corresponde con la gente que está en la universidad o
que egresó de secundaria o la preparatoria y que recientemente se ha incorporado a un
trabajo12. Por no tener ninguna calificación profesional, la mayoría de estos jóvenes se
dedica a trabajos como cajeros, meseros, dependientes, vendedores, comerciantes, entre
otros. Muchos, generalmente, están en su primer trabajo y sus puestos son temporales o
de nivel jerárquico bajo. Obviamente, hay excepciones. En las clases altas los jóvenes
que por alguna razón dejan la escuela pueden dedicarse a viajar o hacer cosas ociosas, o
trabajar con sus padres en sus negocios percibiendo buenos salarios. En este grupo puede
haber mujeres casadas que se dedican solamente a su casa y al cuidado de los niños, o
que trabajan esporádicamente. Algunas mujeres amas de casa se dedican a la venta de
productos de catálogos entre sus amigos, famliares y vecinos colaborando así al ingreso
de la familia. Las mujeres con más posibilidades económicas sólo se dedican al hogar.
12
En México, actualmente la primaria y secundaria son obligatorias.
85
El segundo grupo, de 25 a 35, lo conforman en cierto porcentaje personas con algún
título universitario que continúan estudiando algún posgrado o que se han iniciado en el
mundo del trabajo profesional. Muchos, aunque trabajan como profesionistas,
generalmente reciben salarios bajos y sus puestos son también de nivel bajo por su falta
de experiencia. Las personas con nivel de primaria a bachillerato se dedican a trabajos
donde la juventud, la experiencia y determinada capacitación laboral son valoradas. Estas
personas tienen niveles medios en la jerarquía laboral, generalmente. En este grupo
también podemos encontrar amas de casa en situaciones similares señaladas en el grupo
previo.
El tercer grupo 36-55 se corresponde en general con personas con experiencia en su
trabajo y con un nivel mayor en la empresa o lugar de trabajo. Muchos son jefes o
responsables de área, altos ejecutivos y directivos; perciben mejores salarios que los
inexpertos que se inician. Por ejemplo, un albañil en este rango de edad es “maestro”
albañil o el responsable de construcción y tiene a su cargo a otros subordinados. Esto
ocurre con frecuencia en relación con la experiencia, los años de entrenamiento o
capacitación, el desarrollo de habilidades diferentes y porque la gente a esta edad
mantiene o busca una vida estable y se preocupa por recibir un mejor salario y satisfacer
la necesidad de autorrealización. También en este grupo hay personas que pueden estar
trabajando y estudiando al mismo tiempo. Hay también personas que han conseguido
algún trabajo permanente y se dedican a éste sin ninguna otra pretensión. Mujeres amas
de casa también se encuentran en este grupo.
El último grupo de 56-65 años está integrado por personas que se mantienen en su trabajo
con el máximo nivel que alcanzaron, pero ya no hay muchos en puestos de directivos o
86
jefes. Generalmente, ya hacen trabajos que requieren menos esfuerzo. Algunos prefieren
independizarse y trabajar por su cuenta con algún negocio propio. Algunos ya están
jubilados.
Estas clasificaciones se hicieron entonces considerando las fases de la vida de los
mexicanos en general, pero, por supuesto, esto no es categórico. Hay excepciones, sobre
todo en las personas de niveles socioeconómicos altos y bajos. Los privilegios corruptos
y el desempleo, por ejemplo, pueden ser razones para que haya desfases en la
clasificación seleccionada.
Sexo
Como en todo estudio variacionista, la variación entre hombres y mujeres no puede
dejarse a un lado. Dado que en algunos estudios sociolingüísticos previos (Perissinotto,
1975; Vuskovich, 2006) se han identificado algunas diferencias entre hombres y mujeres
con respecto a la producción de hiatos, pero no han sido concluyentes, en este estudio no
postulamos hipótesis alguna al respecto. Sin embargo, pueden encontrarse datos que
apoyen o rechacen las ideas vigentes.
Nivel educativo
En México, de acuerdo con las estadísticas del Instituto Nacional de Estadística,
Geografía e Informática (INEGI), el índice de alfabetismo en México en el 2005 fue de
91.6%. Sin embargo, en Quintana Roo, en ese mismo año sólo el 58.6% de la población
de 15 años en adelante contaba con nivel educativo básico (primaria y secundaria); el
16.9% tenía el nivel medio superior (bachillerato); y el 14.3% había realizado estudios de
educación superior (licenciatura). No se incluyó en el reporte la población con posgrado.
87
Estas cifras muestran de alguna manera la composición social del Estado, pues el nivel
educativo es un indicador de estatus socioeconómico en México. La clase trabajadora
generalmente cuenta sólo con primaria y secundaria; la clase media baja con bachillerato
y algunos con universidad; la clase media con estudios universitarios y de posgrado,
aunque puede haber algunos con bachillerato; y la clase alta, bachillerato y universidad.
Veamos la siguiente tabla con datos del INEGI donde se observa la relación entre
ingresos y nivel educativo diferenciado por sexo:
Año/Nivel educativo Sexo del jefe de familia
Jefe hombre Jefa mujer
2000 I.M.E.H D.S N I.M.E.H D.S N
Primaria incompleta 7,489 7,617 4,185 8,146 7,593 1,067
Primaria completa 11,180 10,170 2,948 11,960 10,581 626
Secundaria completa 18,780 18,040 4,150 19,177 18,591 765
Superior/universidad 44,667 35,543 930 40,821 29,470 147
completa
Tabla 1. Ingresos medios equivalentes del hogar
Ingresos medios equivalentes del hogar (I.M.E.H), desviación estándar (D.S.) y número de hogares (N) según nivel
educativo alcanzado y sexo del jefe de hogar. Universo: Jefes de hogar menores de 65 años. México, 2002. Pesos de
2002
Además de la relación que vemos entre nivel educativo e ingreso, en México se observa
también una relación de nivel educativo con prestigio social. Esto se hace patente en el
trato, por ejemplo, con personas que cuentan con un grado universitario, a quienes los
demás se dirigen por su título: licenciado, maestro o doctor. O en aquellos casos en los
cuales una familia trata al hijo mayor, que está estudiando el bachillerato y tiene el mayor
88
grado educativo de la familia, con respeto y admiración; y toman en serio sus opiniones
porque se le considera más inteligente, más culto, más apto para convivir en la sociedad.
Muchos consideran la educación como un medio de movilidad social.
Con relación a la lengua misma, hay una creencia generalizada de que la gente más
educada habla “mejor”. Es decir, que su lengua de uso es la lengua estándar o que debería
serlo. Cuando esto no ocurre, el resto de la comunidad (con distintos grados de
educación) actúa en consecuencia mostrando actitudes de falta de respeto. Por lo anterior,
para este estudio seleccionamos la variable nivel educativo con los siguientes
subfactores:
Nivel educativo
Primaria y secundaria
Preparatoria
Universidad y posgrado
Tabla 2. Nivel educativo y subfactores
La primaria y la secundaria se agruparon dado que ambas conforman el nivel básico en
México y es obligatorio en todo el país. La universidad y el posgrado se integraron
porque en la actualidad se nota que muchas personas que estudian la universidad
continúan con sus estudios en el siguiente nivel y en general no se observan grandes
diferencias entre uno y otro nivel.
Esta variable de nivel educativo desempeña un papel relevante para esta investigación
porque la sugerimos como la principal motora no del cambio de hiato a diptongo, sino de
las tendencias hacia la variante [j] o [e̯]. Vuskovich (2006) estudió la resolución de hiatos
89
en la ciudad de México desde una perspectiva sociolingüística considerando la edad y el
género como variables externas, y los grupos vocálicos /a + e/, /e + a/, /o + a/ y /o + e/ en
el nivel postléxico. El autor encontró que la mayoría de estos grupos permanecen
heterosilábicos, es decir, el hiato se mantiene. Sin embargo, cuando la resolución se
efectúa, se recurre principalmente a las siguientes estrategias con la frecuencia
correspondiente al orden de aparición: 1) formación de deslizada de vocal no alta 13 V1, 2)
formación de deslizada de vocal no alta V2, 3) elisión de V1, 4) elisión de V2 y 5)
formación de deslizada alta de V1. Vuskovich ha sido el primero en reportar en un estudio
sociolingüístico la existencia de formación de diptongos con deslizadas medias; sin
embargo, no consideró el factor clase social o nivel educativo en su estudio.
Por experiencia en la comunidad de habla, la hipótesis que postulamos es que los
hablantes con mayor nivel educativo van a favorecer el diptongo con la deslizada media
[e̯] y los sujetos con un nivel de instrucción bajo favorecerán el diptongo con la deslizada
alta [j]. Es decir, la variación que se evidencia en la comunidad de habla con respecto a la
diptongación como un tipo de resolución está condicionada por el nivel educativo de los
miembros de dicha comunidad. De manera resumida mostramos a continuación un
cuadro con las variables independientes:
13
En la presente tesis la llamo deslizada media.
90
Variables internas
Calidad de la vocal siguiente El acento
a) [a] a) V1
b) [e] b) V2
c) [o] c) VSS (vocal de la
sílaba siguiente)
Tipo de sílaba
Grado de sonoridad de las vocales
en contacto a) Abierta
a) Creciente b) Cerrada
b) Constante
Tabla 3. Variables internas
Variables externas
Instrumento
Sexo
a) Entrevista
a) Mujer
b) Prueba de transformación
b) Hombre
c) Prueba de reconstrucción fonética
Edad Nivel educativo
a) 18-24 a) Primaria y secundaria

b) 25-35 b) Preparatoria
c) 36-55 c) Universidad y
d) 56-65 posgrado
Tabla 4. Variables externas
3.4 Definición de contextos lingüísticos de la variable: e + V
Como lo hemos expuesto en páginas anteriores, nos interesa observar la resolución de
hiatos en un contexto bastante limitado: las formas finitas y no finitas de los verbos –ear
91
en español mexicano. Así, tendremos verbos en cualquier tiempo y modo, además de
infinitivos, gerundios y participios. Los contextos también están limitados por:
• La calidad de la V2: [a], [e] [o]
• Sílaba abierta o cerrada
• Acento en la V1, V2 o VSS
• Sonoridad creciente o decreciente
3.5 Hipótesis
A manera de resumen, presentamos las hipótesis de esta investigación:
1. La formación de diptongo es la resolución de hiato más utilizada en los verbos –
ear en español mexicano.
2. En el caso de vocales idénticas en contacto con los verbos –ear, no ocurre que una
se elida; sino que formará diptongo.
3. El acento es la principal condicionante lingüística que inhibe la formación de
diptongos, ya que las vocales que reciben acento son más resistentes a los
cambios.
4. En español mexicano hay una tendencia a evitar secuencias vocálicas con
sonoridad constante; es decir, se prefiere una secuencia vocálica cuyos elementos
se distingan lo más posible en cuanto a sonoridad.
5. La traslación acentual en español mexicano no es favorecida.
6. Las sílabas abiertas favorecen el mantenimiento del hiato.
92
7. Los grupos más jóvenes favorecen la resolución del hiato con estrategias
diferentes a la heterosilabificación.
8. Las personas con nivel educativo alto favorecen la deslizada media [ĕ], mientras
que aquéllas con un nivel bajo favorecen la deslizada alta [j].
9. La entrevista favorece la resolución de hiatos con estrategias diferentes al
mantenimiento del mismo.
3.6 Sujetos
3.6.1 Población
Respecto a la población seleccionada para este estudio, cabe aclarar aquí que ésta se
seleccionó por cuestiones de interés personal, por el acceso más fácil a los miembros de
la comunidad y por mi conocimiento y experiencia con la comunidad de habla, ya que
todo esto facilita la interpretación de las variables sociales, su interacción y el tipo de
variación existente.
Dicha población se ubica en México, un país con el mayor número de hispanohablantes
(100,000,000 aproximadamente) en el mundo. Chetumal, la población de interés para esta
investigación, es la capital del Estado de Quintana Roo en México. Dicho estado está
localizado en el sureste del país, en la península de Yucatán, y tiene frontera con Belice.
Abajo se indica la localización de Chetumal.
93
Figura 18. Ubicación de Chetumal
El Estado de Quintana Roo tiene una tasa de crecimiento poblacional anual de 5.95% ,
esto como resultado de la sostenida inmigración procedente principalmente de la
Península de Yucatán, Veracruz, Distrito Federal y Guerrero, entre otros, que llegaron a
las zonas turísticas del norte del Estado y a Chetumal en el Sur. Se estima una población
indígena maya del 23 % y de éstos las mayoría es bilingüe: español y maya (92.8 %)
(Enciclopedia de los Municipios de México, 1999).
De acuerdo con el censo 2005 proporcionado por el Instituto Nacional de Estadística,

Geografía e Informática de México, la población total de Chetumal es de 136,825
habitantes; 67,039 son hombres y 69,786 son mujeres. Por edades, tenemos la siguiente
distribución:
Grupos por edad Número de

quinquenal habitantes
15-19 años 13,739
20 -24 13,057
25-29 11,598
30 -34 11,410
35-39 10,119
40-44 8,812
45-49 7,128
50-54 5,557
55-59 3,965
60-64 2,871
65-69 1,854
70-74 1,285
75-99 1,836
Tabla 5. Habitantes por grupos etarios
94
Lipski (2004) distingue en general cuatro zonas dialectales en México: México central,
Noroeste de México, Yucatán, y Dialectos Costeros -Veracruz, Tabasco y Acapulco-.
Aunque por su ubicación en la península de Yucatán y por tener una población maya
bilingüe (características que comparte con Yucatán y Campeche, los otros estados que
forman parte de la península), podría sugerirse que en Chetumal predomina el dialecto
yucateco, la constante inmigración de gente procedente de zonas dialectales diferentes
(central y costero principalmente) hace de la ciudad un encuentro de dialectos. Además,
por colindar con el país de Belice, Chetumal es un centro de comercio y de estudios para
los beliceños quienes visitan la ciudad con regular frecuencia o residen en la misma para
realizar estudios.
3.6.2 Muestra
El tipo de muestreo para este estudio es aleatorio estratificado; es decir, considerando las
variables externas de edad, sexo y nivel educativo, que consideramos mantienen una
relación con las variables lingüísticas, conformamos estratos que representan la población
y que cada uno funciona independientemente. En cada estrato aplicamos un muestreo
aleatorio estratificado también para elegir los elementos concretos. La técnica usada para
conseguir a los informantes fue la del “amigo de mi amigo”; es decir, a través de
conocidos se consiguieron contactos que ayudaron a conformar la muestra. Inicialmente
se diseñó la muestra con un total de 48 sujetos, teniendo una distribución uniforme de dos
informantes en los diferentes estratos. Sin embargo, fue difícil encontrar sujetos para cada
estrato por lo que la muestra resultó al final con 38 informantes:
95
Edad Nivel Educativo Mujeres Hombres Total
18-24 Primaria y secundaria 2 1 3
Preparatoria 2 1 3
Universidad y Posgrado 2 2 4

Preparatoria 2 2 4

Preparatoria 2 2 4

Preparatoria 0 0 0
Total 20 18 38
Tabla 6. Distribución de la muestra
Se seleccionó este tipo de muestreo dado que se trata de un estudio sociofonético en el
que las variables sociales desempeñan un papel importante y es esencial contar con
sujetos en cada categoría de los diferentes grupos de variables. Consideramos que se
requería de por lo mínimo dos informantes de cada sexo por cada variable para lograr una
representatividad en la muestra; sin embargo, fue imposible encontrar hablantes mayores
de 55 años con preparatoria y universidad y algunos de los otros grupos.
El uso de corpora ya elaborados o muestras aleatorias simples no parecen adecuados para
cumplir con los objetivos de este trabajo de investigación, pues nos enfrentaríamos con
varias dificultades: no encontrar representatividad de todas las variables de interés en la
población; se podría tener más o menos sujetos (cobertura inadecuada); y falta de
cooperación por parte de algunos sectores de la población. Por otra parte, dado que la
intención es obtener muestras de la lengua vernácula en los informantes a través de la
entrevista sociolingüística, en el caso del muestreo aleatorio simple, entablar una
conversación con un completo extraño (como sería el entrevistador) inhibiría de alguna
96
forma la producción de los sujetos de un estilo de habla más espontánea. Trabajar con un
corpus recogido por otros investigadores carecería de esta representatividad de las
variables sociales de nuestro interés.
3.7 Instrumentos
En consonancia con la metodología variacionista y el enfoque experimental, para esta
investigación utilizamos la entrevista sociolingüística en la tradición de Labov y la
complementamos con una prueba de sombreado y reconstrucción fonética (shadowing-
task en inglés), y otra de transformación, las cuales facilitaron una buena cantidad de
observaciones que integran el corpus de análisis. Enseguida describimos cada uno de los
instrumentos.
3.7.1 La entrevista sociolingüística
Se seleccionó este instrumento considerando que, por ser tradicional de la metodología
variacionista, nos permitiría observar la variación que nos interesa y recoger datos
directamente de los hablantes de la comunidad. La principal preocupación con la
entrevista, como es bien sabido, es la paradoja del observador. Si bien es cierto que la
entrevista como tal supone un acto de habla definido en un contexto formal, en un
formato dado (entrevistador-entrevistado), el tipo de preguntas que se formulan y las
habilidades del entrevistador desempeñan una función importante para motivar una
lengua vernácula por parte del informante.
97
Esta entrevista, siguiendo a Labov (1972b), está estructurada en módulos de preguntas
alrededor de temas específicos, tales como la niñez, el trabajo, el barrio o la ciudad,
peligro de muerte, entre otros; sin embargo, el protocolo se adoptó al contexto mexicano-
chetumaleño14 incluyendo preguntas que hacen referencia a la comunidad de habla de
interés, como la que alude a la presencia de beliceños en Chetumal. Aunque se contaba
con el protocolo, dependiendo del informante y la manera como se desarrolló la
entrevista, se añadieron o cambiaron preguntas, pues el objetivo era motivar el habla
espontánea y natural de los informantes.
Las entrevistas tuvieron una duración de 30 minutos y algunas se llevaron a cabo en la
casa de los mismos informantes, cuando así lo solicitaron; o en un espacio cerrado de la
Universidad de Quintana Roo, pues por ser un lugar público los sujetos se sentían con
confianza y tenían la seguridad de que era un trabajo de investigación serio. La entrevista
fue personal. Solamente el informante y la entrevistadora participaron en la entrevista. Se
utilizó una grabadora digital y micrófono de corbata.
Antes de la entrevista, los informantes tenían que leer el formato de consentimiento de
participación donde se les informaba sobre el estudio y tenían que firmarlo15. No se les
pidió en la entrevista ningún dato personal, excepto su nombre (no necesariamente
apellido), su edad y nivel educativo.
14
Ver protocolo de entrevista en el Apéndice A.
15
Ver Forma de consentimiento en Apéndice E.
98
3.7.2 Prueba de sombreado y reconstrucción fonética
Esta técnica, usada por van der Veer (2006) en su estudio sobre los diptongos en italiano,
en combinación con una prueba de restauración de fonemas, es una nueva herramienta en
el campo de la investigación de la variación lingüística.
Lambert (1988), citado por van der Veer (2006), recomienda la tarea del sombreado para
el entrenamiento de intérpretes simultáneos y define dicha tarea como:
[…] a paced, auditory tracking task which involves the

immediate vocalization of auditorily presented stimuli, i.e.
word-for-word repetition in the same language, parrot-style, of
a message presented through headphones (p.381).
Se le llama sombreado porque uno o algunos segmentos de una palabra son cambiados
por ruido blanco; también recibe el nombre de reconstrucción fonética porque el oyente
debe repetir lo que escucha reconstruyendo los sonidos faltantes; es decir, debe cubrir los
huecos (que generalmente por contexto son fáciles de deducir). Esta técnica del
sombreado se aplicó a 21 oraciones breves (máximo ocho palabras). Los verbos –ear
están distribuidos de la siguiente manera: 7 en presente simple (cuatro con sílaba abierta
y tres con sílaba cerrada); cuatro en pretérito (tres con sílaba abierta y uno con sílaba
cerrada) y tres en futuro (sólo hay con sílaba abierta). Hay cinco enunciados distractores
(fillers) y dos más son de práctica al inicio de la prueba.
La selección de los verbos para estos enunciados se hizo considerando su frecuencia de
uso: 75% son de alta frecuencia y 25% de mediana frecuencia, según el Corpus del
español (Davies, 2002). Esto se hizo considerando que, con una selección arbitraria de
los verbos, los informantes podrían no estar familiarizados con ciertos verbos y, en
consecuencia, podrían alterarlos al intentar repetir el enunciado. Un segundo criterio para
la elección de estos verbos fue el contexto fonético alrededor de la secuencia vocálica. Se
99
escogieron los verbos cuyo grupo vocálico estuviera precedido por una oclusiva /b, p, t,
k/ y en un solo caso por la fricativa [] pues limitar el contexto fonético a estos
segmentos facilitaría el análisis acústico. Se integraron todas las personas gramaticales
que implican las vocales /a,e,o/ en los diferentes contextos de sílaba abierta y cerrada de
las desinencias verbales, así como los diferentes patrones acentuales: acento en la V1, ó
en la V2, o en la VSS 16.
Los enunciados grabados fueron leídos por una mujer joven originaria de Chetumal, la
población de interés. Dado que en la literatura se señala que los hiatos tienen una
duración mayor que los diptongos, con el objeto de controlar la duración y mantenerla
constante, se le pidió a la mujer leer todos los enunciados con hiatos (aunque ella misma
espontáneamente generaba diptongos en algunos casos). Se decidió uniformar la duración
según los hiatos y no los diptongos porque por experiencia observamos que los verbos –
ear en presente simple generalmente no se diptongan, pues la V1, la [é] en todos los casos
es la que recibe el acento prosódico. Si se diptongaban todos, estas formas sonaban
forzadas e improbables. Además, dada las reglas sobre la producción de hiatos, todas
estas secuencias deberían pronunciarse como hiatos. Así para evitar tener algunos hiatos
y algunos diptongos, todos se produjeron como hiatos. La velocidad del habla se controló
de manera que fuera similar en todas las oraciones. Con ayuda de Praat (Boersma y
Weenink, 2008) se tomaron las medidas del hiato de cada verbo y con el programa
Audacity, un editor digital de audio, se hizo el sombreado; es decir, se eliminó el hiato y
se rellenó ese espacio, teniendo las medidas precisas, con ruido blanco. Las oraciones se
16
Ver lista de enunciados en Apéndice B.
100
ordenaron empezando por los de práctica y después mezclando las oraciones en presente,
en pasado y en futuro, e intercalando los enunciados distractores.
Además del input auditivo, se elaboraron unos dibujos17 que representan el contenido de
las oraciones con el fin de apoyar el significado de lo escuchado y facilitar la repetición.
Así, antes de escuchar la oración, los sujetos veían los dibujos y esto les ayudaba a
entender o predecir más fácilmente lo que escuchaban. Se decidió complementar esta
técnica con dibujos después de que en un estudio piloto realizado se observara que los
informantes, confiándose sólo en el input auditivo, pedían escuchar la oración hasta tres
veces. Con el uso de los dibujos, escuchar la grabación una vez era suficiente la mayoría
de las veces.
La duración de la prueba fue de 15 minutos como máximo, y se realizó inmediatamente
después de la entrevista. Los informantes escuchaban los enunciados y debían repetirlos
tales cuales en cuanto la grabación terminaba. Podían escuchar la oración dos veces, si
era necesario. Las instrucciones se daban al inicio y se hacía la práctica con ellos (que
incluía dos enunciados). Para esta prueba de sombreado y reconstrucción fonética se usó
una computadora portátil con micrófono y audífonos Plantronics. En la medida de lo
posible, estas pruebas se realizaron en un lugar cerrado sin ruidos.
17
Ver dibujos en Apéndice D.
101
3.7.3 Prueba de transformación
La prueba de transformación consiste en la lectura de enunciados18 fraccionados en tres
juegos de tarjetas. En el primero incluimos un adverbio de tiempo junto con el sujeto;
esto es con la intención de que los informantes sepan en qué tiempo conjugar los verbos.
El segundo juego de tarjetas contiene los verbos en su forma infinitiva. En total tenemos
21 verbos, de los cuales cinco son distractores y dos son de práctica. Cinco corresponden
a presente, cinco a pasado y cuatro a futuro. Finalmente, en el tercer juego de tarjetas
tenemos un complemento corto, el cual iniciará con oclusiva en los casos en los que la
secuencia vocálica pertenezca a una sílaba abierta. Esto se hizo así para uniformar el
contexto fonético posterior al grupo de vocales y facilitar el análisis fonético. La
selección de los verbos para esta prueba se hizo atendiendo los mismos criterios
utilizados para la prueba de sombreado y reconstrucción fonética.
La duración de esta prueba era de 10 minutos aproximadamente y se realizaba
posteriormente a la prueba de sombreado y reconstrucción fonética. Las tarjetas estaban
enumeradas y se colocaban cara abajo en el orden que debían leerse. Los sujetos de
estudio debían tomar una tarjeta de cada juego, voltearla y leer la oración completa y de
corrido conjugando el verbo en infinitivo en el tiempo que concordara con el adverbio de
tiempo de la primera tarjeta.
En conjunto, la entrevista y estas pruebas fonéticas tomaron una hora aproximadamente.
Dado que la muestra incluyó finalmente sólo 38 sujetos, los datos recogidos por cada
18
Ver enunciados en Apéndice C.
102
instrumento integraron un considerable corpus (de 1151 ocurrencias) que nos ha
permitido verificar o rechazar nuestras hipótesis.
3.8 Procedimientos para el análisis de los datos
Con el fin de cumplir con el Principio de Responsabilidad (Principle of Accountability),
se consideraron todas las formas finitas y no finitas de los verbos –ear. Si en la prueba de
sombreado o en la de transformación resultaron confusiones de verbos, pero se mantenían
verbos -ear, esas ocurrencias se aceptaron; por ejemplo, si en vez de “bateó”, algún
sujeto la confundió con otro verbo como volteó”, ésta se contaba. Sólo se descartaron las
ocurrencias de verbos que no eran –ear. Tampoco se contaron los casos de
hipercorrección: uso de las desinencias de los verbos –ear para los verbos –iar, pues
solamente nos concentramos en este estudio en los verbos –ear y nuestro objetivo no es
analizar la hipercorrección que se da con los verbos -iar, aunque obviamente la presencia
de casos de hipercorrección se consideraron de manera aislada en el análisis cualitativo.
Otro tipo de confusiones que pueden surgir en la recolección de datos es que los sujetos
consideren un verbo –ear como –ar y, por tanto, las desinencias se apeguen a las de –ar.
Estos resultados, sin embargo, serían los mismos si los informantes recurrieran a la
elisión de la V1 en la resolución de hiatos. En estos casos se analizó la frecuencia de uso
del verbo y si resultó ser de alta frecuencia, se consideró elisión. Si era de mediana
frecuencia, se analizó como un caso aparte.
103
3.8.1 Análisis acústico
Atendiendo estudios previos, se consideró la duración de las secuencias y los valores
formánticos como los correlatos acústicos para determinar si las secuencias se
pronunciaban como hiatos o diptongos. Al respecto, recordemos lo que dice Aguilar
(1999):
[…] we say that a hiatus has become a diphthong when at least two of the
following conditions are met: (a) there are not vowel targets but a continuous
formant movement from a frequency area to another; (b) F1 and F2 are situated
at lower frequency areas than the intended hiatuses; (c) duration is reduced.
Con el fin de determinar la estrategia usada por los hablantes, el primer paso a seguir fue
la extracción de las observaciones de los verbos –ear, ya sea en formas o infinitas en los
tres instrumentos empleados. Se obtuvo así un total de 1151 observaciones después de
desechar algunas por su baja calidad de grabación e imposibilidad de analizarlas en los
espectrogramas. Enseguida se calcularon las medidas de duración de cada secuencia
vocálica utilizando espectrogramas de banda ancha (500 Hz). Dado que para las pruebas
de sombreado y transformación se usaron palabras cuya primera consonante en contacto
con la secuencia vocálica fuera una oclusiva /p t k b d/, se midió la duración a partir del
primer impulso glotal de la vocal en cuestión después de la barra de explosión que sigue
al silencio propio de estas consonantes.
Las consonantes posteriores a la secuencia fueron /s l /. Siguiendo a
Martínez Celdrán (1998) y las propias observaciones, en el caso de la fricativa /s/ que
apareció después de la vocal, la transición es evidente por el ruido turbulento y los
inarmónicos, por lo que la medición se calculó hasta el último impulso glotal claro de la
104
vocal. [se caracterizan por una intensidad mucho menor que las vocales
vecinas, lo que se refleja en el negror de las zonas formánticas. Así, observando la
pendiente de intensidad y las zonas formánticas, se determinó el fin de la secuencia en el
punto de caída de la pendiente de intensidad.
Con las nasales/ m n/ y la lateral /l/, consideramos la diferencia en energía e intensidad de
los formantes entre éstas y la vocal que le antecede. En realidad, la diferencia es muy
marcada y a partir del cambio de intensidad se marcaba el final de la secuencia. El
ejemplo debajo de la secuencia /ea/ seguida de una nasal alveolar ilustra este punto:
Figura 19 Secuencia /ea/ seguida de nasal alveolar
En cuanto a la vibrante simple, se consideró que muestra interrupción de energía (muy
similar a una oclusiva) con una barra de explosión generalmente. El final de la secuencia
vocálica se marcó en el último pulso glotal antes de la interrupción. La figura siguiente
nos muestra este caso.
105
Figure 20 ¨batearán
Además de la duración, se tomaron como parámetros los valores de los formantes F1 y
F2, aunque en la literatura se enfatiza el valor de F2 como el factor determinante para la
distinción entre hiatos y diptongos (Martínez Celdrán, 1998). Sin embargo, los valores
formánticos de F1 se consideraron para establecer cambios en la calidad de la vocal, pues
las variantes muestran deslizadas medias y altas. Garrido (2007) encontró que “the lower
the value of the F1 in the first element of a mid/low vowel sequence, the higher the
degree of diphthongization”. Por su parte, Aguilar (2006) señala que “las diferencias
entre el resultado fonético de la pérdida de silabicidad de una vocal alta y el de una vocal
no alta residen obviamente en la localización de las frecuencias, pero no en el tipo de
movimiento.
Adicionalmente, otro criterio a observar en los espectrogramas, según Aguilar (2006), es
que una secuencia vocálica se convierte en diptongo cuando “una de las dos zonas
estables desaparece a la vez que se aprecia una transición continua del segundo formante
desde una zona de frecuencias formánticas a otra”. Por ello, se tomó también como
106
parámetros la pendiente de la trayectoria formántica, la observación y análisis de los
oscilogramas y espectrogramas, y la valoración auditiva impresionista de dos
codificadores. Con todos estos datos, se clasificaron las observaciones según el tipo de
resolución usada. Veamos el procedimiento paso a paso:
Primero se midió la duración de cada secuencia, después se registraron y se extrajeron los
valores de los formantes F1 y F2 cada treinta milisegundos. Se observó que muchas
duraciones de las secuencias de este corpus eran mayores que las reportadas en la
literatura tanto para hiatos como para diptongos. Por tanto, estos valores obtenidos cada
treinta ms. fueron suficientes para el análisis posterior de la pendiente y definición de la
estrategia utilizada. Cabe aclarar que en el caso de secuencias breves menores de 90 ms,
se cambió la extracción de los valores a cada 20 ms. La intención con esto era tener un
panorama general de la forma de la pendiente y los valores de los formantes en diferentes
momentos para determinar el vocoide implicado.
Siguiendo el mismo procedimiento realizado en previos estudios para el análisis de
diptongos (Borzone de Manrique, 1979; Maddieson and Emmorey, 1985), se procedió a
establecer fases en la trayectoria formántica de F1 y F2 para identificar las vocales
implicadas y observar los cambios entre las distintas fases de la secuencia. Estas fases se
corresponden con el segmento inicial, una transición y el segmento final. Sin embargo, a
diferencia de estudios previos que dividen la secuencia al 25, 50 y 75%, en este estudio
calculamos un promedio móvil representativo de cada área. Es decir, se extrajeron los
valores de F1 y F2 cada 30ms.y dependiendo del número de intervalos, se agruparon en
tres fases: inicial, media y final y se calcularon sus promedios. Esto nos permitió observar
la duración en cada fase, el cambio de velocidad y de zonas de frecuencias a lo largo de
107
toda la secuencia. Consideramos importante tomar en cuenta el inicio de la secuencia y su
duración siguiendo a Borzone de Manrique (1976) en su estudio de diptongos del
español, quien encontró que una distinción entre hiatos y diptongos es que los primeros
muestran una duración mayor de la misma zona de frecuencias en el área inicial, que se
correspondería con la primera vocal objetivo. Cabe aclarar también que aunque se
segmentó la secuencia en tres áreas, cuando se hizo el análisis integrando todos los
parámetros, se mantuvieron visibles los promedios móviles de los valores de los
formantes, pues ofrecían una descripción más clara del movimiento de la trayectoria de la
pendiente y de las frecuencias de los vocoides presentes. Es decir, para casos confusos, se
recurría a todos los promedios móviles y no sólo a las tres fases.
En los casos de elisión, la misma Aguilar indica que “la elisión en el contacto de vocales
idénticas o diferentes se identifica por la presencia de un único segmento, sin que en la
secuencia interconsonántica varíe ni la frecuencia de los formantes ni la forma de onda”.
Para evitar confusiones con producción de vocales largas en las secuencias de vocales
idénticas (que en este estudio es sólo [e.e], se registraron los valores medios de ejemplos
de la vocal [e] pronunciada por los informantes en los mismos contextos fonéticos, que
sirvieron de parámetro para determinar si trataba de una vocal larga o de elisión.
La valoración auditiva impresionista de dos codificadores se basó únicamente en
escuchar la palabra completa y registrar la estrategia percibida; es decir, cada codificador
de manera independiente escuchó las palabras que incluían las secuencias de interés y
anotó la estrategia que percibió. Aquí la elección era entre hiato, diptongo con media,
diptongo con alta y elisión. Sin embargo, algunos casos de la estrategia de fusión y de
hiato con /i/ se identificaron en este análisis. Después se compararon las apreciaciones de
108
cada codificador. Si no coincidían, la determinación de la estrategia usada se basaba en
los otros parámetros.
La pendiente de la trayectoria formántica se calculó a partir de las tasas de crecimiento de
los intervalos de frecuencias y su duración. De esta manera, fue posible ver la presencia
de cambios continuos (diptongo) o de un cambio brusco (hiatos) en la pendiente.
Para establecer la estrategia de resolución usada, se analizaron las palabras extraídas de
los tres instrumentos agrupándolas por informante. Así, atendiendo la duración total de la
secuencia, los promedios de los valores de F1 y F2 en las tres fases y su correspondiente
duración, las tasas de crecimiento por fase y en conjunto de la pendiente, y la estrategia
percibida por los codificadores se establecía la estrategia de resolución. Los valores de F1
y F2 de los vocoides objetivo se compararon con los valores que en la literatura aparecen
como valores generales de las vocales del español (Martinez Celdrán, 2007) y con los
valores de /e/ extraídos de la producción de cada informante. En algunos casos en los que
los parámetros daban resultados ambiguos, se revisó cada uno de los valores de F1 y F2 a
lo largo de toda la secuencia y no sólo los promedios; también esto fue útil para
determinar cambios continuos o un cambio brusco en la pendiente.
Estas mediciones y datos acústicos fueron imprescindibles para este estudio, ya que por
ser un estudio también variacionista se requieren variables discretas, y para llegar a éstas
fue necesario establecer primero las estrategias de resolución, las cuales son las variantes
que se utilizan en el análisis cuantitativo.
109
3.8.2 Análisis estadístico
Ya que esta investigación es de corte eminentemente cuantitativa, el análisis estadístico
es una parte esencial de la misma. Dado que para el análisis de nuestra variable partimos
de varios factores lingüísticos y sociales, necesitamos evaluar los efectos de cada uno de
ellos en nuestras variantes a través de un análisis multivariado. La cuantificación y
análisis estadístico de los datos se hizo con Goldvarb X (Sankoff et al., 2005), un
programa basado en análisis de reglas variables. GoldVarb X utiliza un procedimiento de
regresión múltiple que, de acuerdo con Sankoff (1988) y refieriéndose a VARBRUL, nos
permite determinar qué factores tienen un efecto estadísticamente significativo en la
selección de una variante; si el efecto favorece o desfavorece; y el peso del efecto cuando
se consideran todos los factores de manera simultánea.
Los grupos factoriales considerados para el análisis fueron: instrumento de recolección,
sexo, edad, nivel educativo, calidad de la vocal siguiente, grado de sonoridad, acento,
tipo de sílaba y tipo de forma finita o infinita. Se conformó un código de letras para
identificar cada uno de estos factores y sus subfactores19. Cada ocurrencia se etiquetó con
su código correspondiente integrando toda esta información. Ya que la función de
regresión múltiple de Goldvarb requiere de un valor de aplicación binario; es decir, sólo
dos factores para la variable dependiente, usaremos el valor del mantenimiento de hiato
[e] V como el valor de aplicación y agruparemos las otras variantes en un grupo que será
resolución. Así, primero analizaremos el mantenimiento y la resolución; posteriormente
cambiaremos los valores de aplicación usando diferente valor de aplicación según las
diferentes estrategias comparando esa estrategia contra el grupo del resto.
19
Ver en Capítulo 5 tablas de variables internas y externas.
110
Se graficarán los resultados arrojados por el programa y se harán también tabulaciones
cruzadas para analizar las interacciones entre los factores. De esta manera, se
identificarán los porcentajes, las ponderaciones y el grado de significancia de cada factor
y subfactor en relación con las diferentes variables dependientes.
Análisis de casos especiales
Las estrategias de resolución que se identificaron en el estudio acústico, pero que no
estaban planteadas inicialmente también se analizaron con GoldVarb. Las ocurrencias de
autocorrección se consideran en el análisis cualitativo.
111
Capítulo 4: Análisis de los resultados
4.1 Análisis de los resultados acústicos
Analizando la duración como uno de los principales correlatos acústicos para distinguir
entre hiatos y diptongos, tomamos las medidas en los tres instrumentos de recolección y
no se encontró mucha diferencia entre las duraciones de secuencias en la entrevista y la
prueba de sombreado. En realidad, los promedios de la entrevista y de la prueba de
sombreado son similares. En la prueba de transformación se notó una ligera duración
mayor. En la tabla de abajo se presentan los promedios de los diptongos e hiatos según el
instrumento e incluyendo a todos los informantes.
Duración en entrevista y prueba de sombreado (en segundos)

hiato con /e/ 0.17
hiato con /i/ 0.16
diptongo con // 0.11
diptongo con /j/ 0.12
Tabla 7. Duración de hiatos y diptongos en entrevista y prueba de sombreado
Duración en prueba de transformación (en segundos)
hiato con /e/ 0.19
hiato con /i/ 0.20
diptongo con // 0.13
diptongo con /j/ 0.16

Tabla 8. Duración de hiatos y diptongos en prueba de transformación
112
Como se observa, la duración de las secuencias con vocoides altos en general es mayor
que la de los vocoides medios y esto es por la duración intrínseca de la vocal misma, al
parecer. Cabe aclarar que aunque se presentan estas medidas, éstas son sólo promedios
porque en realidad hay muchos traslapes entre hiatos y diptongos. Incluso, en un mismo
hablante hay muchas intersecciones, pues todo depende de la velocidad de habla y es
muy difícil controlar esta variable. Por ejemplo, hubo casos de diptongo en la prueba de
transformación cuya duración era mucho mayor que un hiato. Los motivos pueden ser
varios: una preocupación por articular bien los segmentos porque los hablantes se sentían
evaluados o también puede ser un efecto léxico; es decir, si el verbo a conjugar era más
familiar, su realización era más rápida, pero si el verbo no era tan frecuente o familiar,
pues entonces la pronunciación era más lenta. Esto sugiere que la duración, aunque en
general es un indicador de la distinción entre hiato y diptongo, no se puede considerar el
de mayor peso o el único para determinar la naturaleza silábica de las secuencias
vocálicas.
Otro parámetro considerado fue la pendiente de la trayectoria formántica F2. En la
literatura se señala que la pendiente de los hiatos es mayor que la de los diptongos, pero
esto a veces resulta confuso porque no se entiende si es la pendiente completa o si es sólo
a partir del punto de transición. La idea es que la pendiente es mayor a partir del cambio
de una vocal a otra. No obstante, el punto de transición en los hiatos es más visible y fácil
de detectar porque en cierto momento habrá una caída abrupta que indica el cambio de
una vocal a otra. Con los diptongos tenemos transiciones durante casi toda la pendiente y
hay caídas abruptas también, pero la diferencia es que pueden ser varias.
113
Para mostrar esto veamos los resultados arrojados para la secuencia /ea/ con un ejemplo
para ver la diferencia entre diptongo y hiato.
FORMANTE F2
intervalos 1 2 3 4 5 6 7 8 9 10 11 12
hiato 2,389 2,608 2,639 2,708 2,697 2,613 2,475 2,270 2,105 1,969 1,950 2,010
diptongo 2,453 2,448 2,305 2,083 1,940 1,905 1,810

Tabla 9. Valores de F2 en hiato y diptongo
Graficando estos valores, tenemos:
3,000.0
2,500.0
2,000.0
1,500.0 HEA
1,000.0
DEA
500.0
-
1 2 3 4 5 6 7 8 9 10 11 12
Figura 21. Pendiente completa en hiato y diptongo
Como se observa, la duración del diptongo es menor (menos intervalos) y su trayectoria
completa es más pronunciada; el hiato tiene una duración mayor y su la forma de su
trayectoria completa muestra menos inclinación en conjunto. Sin embargo, si medimos la
pendiente a partir de la transición de la zona de frecuencia más o menos estable a la
siguiente zona estable u objetivo de la segunda vocal, esta pendiente es bastante
inclinada, pues muestra el cambio brusco de una a otra vocal. Es decir, la pendiente en
conjunto desde inicio a fin es mayor en los diptongos que en los hiatos, pues estos
114
últimos muestran fases constantes en sus zonas de frecuencias que hacen que la pendiente
no se incline sino hasta que hay un cambio brusco. Y es que es lógico que con menos
tiempo, los cambios en las zonas de frecuencias sean continuos y rápidos en los
diptongos, mientras que en los hiatos los cambios se dan más lentos y generalmente se
observa un solo cambio drástico.
Entonces la pendiente conformada por las observaciones del formante F2 puede ser
tomada como un indicador de la presencia de un hiato o un diptongo. En este trabajo
utilizamos el promedio de las tasas de crecimiento de los registros F2 para cada secuencia
y también calculamos la velocidad de la pendiente de la máxima caída atendiendo los
valores de F2 y los intervalos de duración. Los resultados muestran mucha fluctuación en
las pendientes, pero en promedio tanto la tasa de crecimiento de la pendiente completa
como la velocidad de la pendiente en su punto máximo de caída de los hiatos es mayor
que la de los diptongos. Veamos el ejemplo anterior /ea/, pero ahora con tasas de
crecimiento:
FORMANTE F2 TASAS DE CRECIMIENTO

intervalos 1 2 3 4 5 6 7 8 9 10 11 12
Hiato - 9.2% 1.2% 2.6% -0.4% -3.1% -5.3% -8.3% -7.3% -6.4% -1.0% 3.1%
- - -
Diptongo - 0.2% 5.8% 9.6% -6.9% -1.8% -5.0%
Tabla 10. Tasa de crecimiento de la trayectoria de F2
Se observa claramente cómo la pendiente del diptongo es mucho más pronunciada (tasa
de crecimiento promedio -4.19%) que la del hiato (tasa de -1.31). La pendiente del hiato
es más suave porque su recorrido es indirecto: primero prepara la V1, llega a su vocal
115
objetivo (con lo cual el primer intervalo tiene pendiente relativamente horizontal); a
continuación, se traslada rápidamente a la siguiente vocal (la pendiente en este intervalo
es mayor); una vez en la segunda vocal la marca hasta alcanzar un clímax, con lo que la
pendiente vuelve a ser casi horizontal. En el caso del diptongo el traslado de un área de
frecuencia a otra opera de manera continua, por ello la pendiente es más constante y
directa (no presenta intervalos casi horizontales) con lo que se incrementa la pendiente
(presenta números negativos mayores).
Esta prueba de pendiente es eficiente para diferenciar hiatos de diptongos si se trata de
una misma secuencia y bajo el mismo contexto fonético, y por supuesto si es el mismo
hablante en el mismo contexto. Sin embargo, controlar estas variables es muy difícil y de
ahí que resulten traslapes o la prueba no revele claramente estas diferencias. Nuevamente,
el uso de la pendiente (completa o de la transición) puede ayudar en la definición de
hiatos y diptongos, pero tenemos que recurrir a otros correlatos también. Veamos abajo
algunos espectrogramas que distinguen entre hiato y diptongo con deslizada media y alta:
116
Figura 22. Hiato en“pateo”
Figura 23. Diptongo con deslizada media en “pateó”
117
Figura 24. Diptongo con deslizada alta en “pateó”
En los análisis acústicos se observa que en general, los diptongos empiezan en la primera
fase con valores de F1 y F2 altos de su correspondiente vocal subyacente, mientras que
los hiatos inician con valores de F1 y F2 bajos y alcanzan la vocal objetivo al final de la
primera fase o inicios de la segunda. Es decir, si una /e/ plena, por ejemplo, tiene valores
de F2 de 1676 como mínimo y 2212 ó más como máximo, en los diptongos en la primera
fase de inicio aparecen valores más cercanos al máximo. Al contrario, en los hiatos, se
observan valores más cercanos al mínimo en esta etapa inicial. Esto coincide con el
estudio de Borzone de Manrique (1979) y es otro parámetro que ayudó a definir la
estrategia usada. Por otra parte, con los valores de F1 y F2 se pudieron distinguir las
deslizadas medias de las altas. Con deslizadas altas los valores de F1 son más bajos en
general. También los valores de F2 apoyan con esta clasificación. Aquí cabe aclarar que
en el caso de vocales medias que seguían a la oclusiva velar /k/, sus valores eran muy
altos como efecto articulatorio de su contigüidad con la velar. No obstante, se mantenía
una /e/ que era auditivamente perceptible por los codificadores.
118
Otro resultado que vale la pena notar es que en los casos de elisión de la secuencia /eé/,
en general se percibe una vocal larga, ya que sus duraciones fluctuaron entre .08 y .14.
Esto significa que aunque hablamos de elisión en esta secuencia en particular, en realidad
hay una vocal larga. Esto no ocurrió con otros casos de elisión donde la secuencia se
componía de vocales distintas, pues la duración de esta secuencia reducida era de .05 en
promedio. Para llegar a esto partimos de la comparación de la duración de la /e/, como
resultado de una secuencia subyacente, con la duración de una /e/ simple subyacente.
4. 2 Análisis de los resultados estadísticos de GoldVarb
Habiendo definido las estrategias de resolución utilizadas por los informantes, se
procedió a la codificación de las observaciones, las cuales al final resultaron 1151. De
éstas, sólo 105 se recogieron de las entrevistas; 504 provienen de la prueba de sombreado
y 542, de la prueba de transformación. 18 observaciones fueron desechadas por
problemas de grabación que dificultaron su análisis acústico y clasificación
correspondiente.
Aunque inicialmente se plantearon cuatro variantes de la variable dependiente, durante el
análisis acústico se identificaron otras dos estrategias: la formación de hiato con la vocal
/i/ y fusión vocálica teniendo como resultado una tercera vocal. De esta manera, la
variable se analizó en Goldvarb atendiendo seis valores de aplicación diferentes que se
corresponden con cada una de las estrategias identificadas, pues el programa estadístico
es binomial y ofrece regresiones comparando una variante contra el resto.
119
Cabe aclarar también que mientras se realizaba el análisis acústico, se observó que un
mismo hablante mostraba variación en verbos que tenían el mismo contexto fonético pero
se diferenciaban en el tiempo, modo formas finitas e infinitas. Por ejemplo, “pateé” en
pasado y “pateé” en imperativo negativo se resolvían con diferente estrategia por algunos
hablantes. Por tanto, se agregó el factor tipo de forma finita o infinita con ocho
subfactores, que fueron los registrados. Presentamos a continuación la tabla de las
variables con sus respectivos factores y subfactores que se utilizaron en el análisis de
GoldVarb:
Variables internas
Calidad de la vocal siguiente El acento
d) [a] d) V1
e) [e] e) V2
f) [o] f) VSS
Formas finitas e infinitas
(vocal de
a) Presente simple la sílaba
b) Pasado simple siguiente)
Grado de sonoridad de las vocales c) Futuro simple

Tipo de sílaba
en contacto d) Imperfecto
c) Creciente e) Infinitivo c) Abierta
d) Constante f) Gerundio d) Cerrada
g) Participio
h) Imperativo/subjuntivo
120
Variables externas
Instrumento
Sexo
d) Entrevista
c) Mujer
e) Prueba de transformación
d) Hombre
f) Prueba de reconstrucción fonética
Edad Nivel educativo
e) 18-24 d) Primaria y secundaria

f) 25-35 e) Preparatoria
g) 36-55 f) Universidad y
h) 56-65 posgrado
La variable lingüística dependiente con los cambios realizados se muestra abajo:
Variable lingüística dependiente /e V20/
Variantes eV  V jV V iV fusión
Figura 25. Variable lingüística y sus variantes
Considerando de esta manera estos cambios en el análisis, de manera general se observa
que con los verbos -ear la muestra estudiada emplea las seis variantes registradas como
20
V representa aquí cualquier vocal
121
estrategias de resolución de hiatos en diferente proporción. La gráfica abajo ilustra estas
diferencias:
Distribución de las variantes

45
40
35
30
25
20 Porcentajes
15 absolutos
10
5
0
hiato con e diptongo con diptongo con
media alta
Figure 26. Distribución de las variantes principales de resolución
Como puede notarse, la estrategia con más observaciones en la muestra estudiada fue la
de formación de diptongo con deslizada media (39%), seguida por la de mantenimiento

21
del hiato con /e/ (28%) y después nuevamente por la estrategia de formación de
diptongo, pero esta vez con deslizada alta (21%). Si comparamos entonces la estrategia
de mantenimiento versus diptongación (independientemente de la deslizada participante),
tenemos que ésta es la estrategia más usada para resolver el contacto de vocales en los
verbos –ear. El resto de estrategias muestra porcentajes relativamente bajos, aunque de
21
Distinguiremos entre mantenimiento del hiato para referirnos al hiato estándar con /e/ versus hiato con /i/ cuando se
efectúa el mantenimiento con esta vocal.
122
este grupo elisión es la estrategia que sigue por número de casos registrados (8%). El
mantenimiento del hiato con /i/ parece marginal (2%) igual que la fusión (1%). Se
discuten abajo brevemente, pues también son ejemplo de variación.
Enseguida se presentan los resultados de Goldvarb para las variantes (o estrategia) que
resultaron relevantes estadísticamente. Empezaremos con la variante estándar
(mantenimiento del hiato) y proseguiremos con el resto en orden descendiente según su
porcentaje de uso en la muestra. Al final, integramos todos los datos y presentamos una
jerarquización de los factores y subfactores que constriñen la selección de una u otra
estrategia.
4.2.1 Variante mantenimiento del hiato
Empezamos así con los resultados de GoldVarb que se muestran en la tabla siguiente:
123
Total N: 316/1151 Input 0.209 Log likelihood = -329.646
Probabilidad % hiatos con /e/ Total N % Datos
Acento
V1 .97 90 270 23
V2 .27 9 617 54
V3 .19 8 264 23
Rango: 78
Instrumento
Pruebas .52 29 1046 91
Entrevista .30 17 105 9
Rango: 22
Edad
56-65 . 58 31 144 12
18-24 .57 30 332 29
36-55 .51 29 334 29
25-35 .37 23 341 30
Rango: 21
Grado de sonoridad
Creciente .58 30 817 71
Constante .38 22 334 29
Rango: 20
Tabla 11. Factores que contribuyen a la selección de la variante /e/ (hiato).
Como se aprecia en la tabla, dos factores internos (acento y grado de sonoridad) y dos
factores externos (instrumento y edad) son los que parecen condicionar el uso de la
estrategia de mantenimiento del hiato. De éstos, el acento es, sin lugar a dudas, el que
mayor peso tiene en el mantenimiento de la secuencia como heterosilábica; pero más
precisamente es el acento en la V1 el que favorece abrumadoramente esta estrategia. Es
decir, si el acento recae en la vocal /e/ (que es la V1 en todos los verbos –ear), la gran
probabilidad es que se realice un hiato. El grado de sonoridad también desempeña un
papel importante para esta estrategia, pues la sonoridad creciente parece favorecer su uso.
124
En este caso, la secuencia con grado de sonoridad creciente es /ea/ solamente. Veamos la
relación de ambas variables en la tabla siguiente:
Relación variable acento y grado de sonoridad

Total de observaciones : 1151 Valor de aplicación: /e/
N % N % N %
V1 V2 V3 Datos %
Creciente 184/204 90 38/344 11 20/264 8 817 71
Constante 59/66 89 15/268 6 0 0 334 29
Tabla 12. Variables acento y grado de sonoridad con la variante hiato
Tenemos así que las secuencias /éa/, /eá/ y /ea/ presentan porcentajes ligeramente
mayores que las secuencias que mantienen un grado de sonoridad constante. Sin
embargo, cuando la /e/ es tónica, la diferencia es casi nula; ésta se evidencia cuando la V 2
es la tónica, y dado que no se da el caso de formas verbales con secuencias de sonoridad
constante en las que ambas sean átonas, pues no se registraron casos de sonoridad
constante con acento en la V3.
Si bien es cierto que el acento en la V1 muestra una tendencia a favor de los hiatos, el
hecho de que haya un 10% que conlleve a otra estrategia implica traslación o dislocación
acentual. En otras palabras, si la secuencia subyacente recibe el acento en la V1 , pero se
no se realizan hiatos , entonces se entiende que hay informantes que trasladan el acento a
la otra vocal y usan otra estrategia. Este fenómeno se confirmó con el análisis acústico e
impresionista al categorizar las estrategias empleadas.
En cuanto a los factores externos, las pruebas juntas resultaron favorecer el
mantenimiento de los hiatos en contraste con la entrevista. Dado que las pruebas son
125
formas de motivar la lengua y la entrevista tiene como objetivo generar habla espontánea,
de decidió fusionar las primeras.
La edad resultó un factor social clave para la retención de hiatos, siendo tres grupos: los
dos mayores y el de los más jóvenes los que favorecen este tipo de resolución. La
siguiente gráfica muestra la relación edad e instrumento donde se observa la distribución
también:
Relacion edad e instrumento

35
30
25
20
Entrevista
15
10 Pruebas
5
0
18-24 25-35 36-55 56-65
Figura 27. Variables edad e instrumento con /e/ por porcentaje
No se observa una distribución uniforme por grupo etario; es decir, no se muestra un
incremento o decremento constante por edades en la producción de hiatos. Aunque el
grupo de los mayores produce más hiatos, la diferencia no es marcada con respecto a los
otros grupos y, de hecho, el grupo más joven produce más que el siguiente grupo etario.
Por otra parte, la diferencia de número de hiatos entre las pruebas y la entrevista no es
muy grande en la mayoría de los grupos, excepto por el grupo de 25-35 años que realiza
126
un porcentaje mucho mayor de hiatos en las pruebas que en la entrevista. Este grupo es el
que no favorece en general los hiatos.
4.2.2. Variante formación de diptongo con deslizada media
.
Total N: 443/1151 Input 0.322 Log likelihood = --595.356
Probabilidad % diptongos /e/ Total N % Datos
Acento
V2 y V3 .64 48 881 76
V1 .12 8 270 24
Rango: 52
Grado de sonoridad
Creciente .60 46 817 71
Constante .25 21 334 29
Rango: 35
Edad
18-24 .57 43 332 29
25-35 .54 42 341 30
36-55 .46 37 334 29
56-65 . 31 24 144 12
Rango: 26
Instrumento
Entrevista .65 58 105 9
Transformación .52 42 542 47
Sombreado .43 31 504 44
Rango: 22
Nivel educativo
Universidad .62 48 392 34
Preparatoria .47 40 332 29
Primaria y secundaria .40 29 427 37
Rango: 22
Sexo
Hombre .59 46 547 48
Mujer .41 32 604 52
Rango: 18
Tabla 13. Factores que contribuyen a la selección de la variante /e/ (diptongo con deslizada con media)
Como se advierte en la tabla, la formación de diptongo con deslizada media es la
estrategia más utilizada para resolver hiatos en los verbos –ear. Es evidente también el
número considerable de factores que condicionan esta variante: dos variables internas y
127
cuatro externas. De las primeras, el acento, al igual que con la estrategia de
mantenimiento del hiato, se presenta otra vez como factor preponderantemente
determinante en la selección de esta estrategia. Mientras que el mantenimiento del hiato
se constriñe por el acento en la V1 (en la vocal /e/), la formación de diptongo con
deslizada se ve favorecida por la ubicación del acento en la segunda vocal de la secuencia
o en otra vocal de la siguiente sílaba. De manera separada, el porcentaje de diptongos con
deslizada media se incrementa aún más si el acento se ubica en una tercera vocal: V2,
47% y V3, 66%.
Lo anterior implica que la posición o proximidad del acento desempeña un papel
importante, pues a mayor distancia de la secuencia, mayor tendencia a producir diptongos
con deslizada media. Cuando el acento recae en la V1, se inhibe casi totalmente esta
estrategia. Este “casi” nos lleva una vez más al fenómeno de traslación acentual, pues si
la /e/ en el español estándar es tónica, pero se registraron observaciones en las que las
secuencias fueron diptongadas, significa que hay casos de cambio acentual en la muestra
estudiada. Nótese, sin embargo, que los números registrados sobre este fenómeno son
bajos en general.
Otro factor lingüístico relevante es el grado de sonoridad de la secuencia vocálica: si éste
es creciente, los resultados muestran que se favorece la diptongación con deslizada
media. Esto, concretamente, ocurre con la secuencia /ea/ porque el mismo programa de
GoldVarb en la primera corrida arrojó como knockout el subfactor /e/ del factor # 4 que
es “Vocal siguiente”. Es decir, no se da el caso de tener deslizadas medias junto a la
vocal media /e/. Si analizamos ahora la relación entre ambas variables acento y grado de
sonoridad-, tenemos los siguientes resultados:
128
Relación acento y grado de sonoridad
Total de observaciones : 1151 Valor de aplicación: /e/
N % N %
V1 V2 y V3 Datos %
Creciente 16/204 8 358/613 58 817 71
Constante 6/66 9 63/268 24 334 29

Tabla 14. Relación acento y grado sonoridad en diptongos con deslizada media
Tal como muestra la tabla, las secuencias subyacentes /eá/ y /ea/ (en esta última ambas
vocales son átonas) favorecen la formación de diptongos con deslizada media, mientras
que la secuencia de sonoridad constante /eó/ muestra un porcentaje bajo no significativo
(la siguiente vocal /e/ la descartó el mismo programa estadístico por no ocurrir en esta
variante). Las secuencias /éa/ y /éo/ subyacentes que se registraron aquí como formas
diptongadas implican un cambio acentual, ya arriba mencionado. Nótese además que esa
dislocación del acento es independiente del grado de sonoridad subyacente la secuencia,
pues los porcentajes de cada grado son similares.
Las variables externas que parecen constreñir esta estrategia de resolución son la edad, el
instrumento utilizado para la recolección de datos, el nivel educativo y el sexo. Con
respecto a la primero, son los dos grupos más jóvenes los que registran un
favorecimiento. En cuanto al segundo, la entrevista registra una probabilidad mayor de
ocurrencia de diptongación con deslizada media seguida de la prueba de transformación.
En el grupo nivel educativo, son las personas con nivel de estudios universitarios o de
posgrado las que favorecen esta estrategia; y en el grupo de sexo, son los hombres los que
muestran una mayor tendencia. Abajo recogemos en gráficas la relación entre estas
variables externas.
129
Edad e instrumento
100
80
60 Entrevista
40 Transformacion
20 Sombreado
0
18-24 25-35 36-55 56-65
Figure 28. Relación edad e instrumento en diptongo con deslizada media
En esta primera gráfica observamos que hay una clara diferencia entre el instrumento
empleado: en la entrevista se generaron más diptongos con deslizada media, seguida de la
prueba de transformación y finalmente de la de sombreado. Es interesante también que
esta distribución se mantiene en todos los grupos etarios, pero lo que cambia es el
porcentaje de ocurrencias en las pruebas: a mayor edad, menor número de diptongos con
media. Con la entrevista, no se da esta consistencia, pues los grupos medios son los que
producen más diptongos.
Considerando ahora la edad y el nivel educativo, la siguiente gráfica ilustra su relación:
130
Edad y nivel educativo
60
50
40
Primaria y sec.
30
Preparatoria
20
Universidad
10
0
18-24 25-35 36-55 56-65
Figura 29. Relación edad y nivel educativo con /e/ en porcentajes
Vemos una relación clara: a mayor nivel educativo, mayor tendencia a utilizar la
estrategia de diptongación con deslizada media, aunque es claro que el nivel universitario
y posgrado es el que despunta en la gráfica en todos los grupos etarios. También es
evidente, en los grupos de primaria a preparatoria, la relación inversa entre edad y
producción de diptongos con deslizada media; es decir, a mayor edad, menor número de
ocurrencias de esta estrategia, y mientras más jóvenes, más tendencia a favorecer esta
variante. El grupo de universidad y posgrado, sin embargo, no muestra esta consistencia,
pues son los grupos etarios medios (de 25-35 y de 36 a 55) los que encabezan los
porcentajes más altos de diptongos con deslizada media.
Analizando la relación entre edad y sexo, abajo se presentan los porcentajes
correspondientes:
131
Edad y sexo
70
60
50
40
M
30
H
20
10
0
18-24 25-35 36-55 56-65
Figura 30. Relación sexo y nivel educativo con /e/ en porcentajes
Salvo por el primer grupo etario en el que no hay diferencias de sexo en la producción de
diptongos con deslizada media, en el resto de los grupos son los hombres los que tienden
a realizar más esta variante de resolución de hiatos que las mujeres. Sin embargo, dentro
de estos grupos, la diferencia más marcada es en los grupos de 25-35 y de 55-65 en los
que las mujeres registraron 29% y 25%, respectivamente, menos diptongos con media en
comparación con los hombres.
Relación nivel educativo e instrumento

Total de observaciones : 1151 Valor de aplicación: /e/
N % N % N %
Entrevista Transformación Sombreado Datos %
Universidad 19/25 75 101/191 53 68/176 39 392 34
Preparatoria 20/28 71 62/158 39 49/146 34 332 29
Prim. y sec. 22/52 42 64/193 33 38/182 21 427 37

Tabla 15. Variables instrumento y nivel educativo con deslizada media
132
Como se observa, todos los niveles educativos muestran porcentajes mayores en la
producción de diptongos con deslizada en la entrevista, seguida de la prueba de
transformación y finalmente de la prueba de sombreado; es decir, se nota una distribución
uniforme de estos instrumentos en cada grupo educativo. Asimismo, se observa una
relación directa entre el instrumento y el nivel educativo: a mayor nivel educativo, mayor
uso de la estrategia de diptongación con deslizada media en todos los tipos de tipos
instrumentos; a menor nivel educativo, menor número de observaciones en todos los
instrumentos.
Prosigamos ahora con la relación entre las variables sexo y nivel educativo:
Relación sexo y nivel

educativo
80
60
40 M
20 H
0
Primaria y sec. Preparatoria Universidad
Figura 31. Relación sexo y nivel educativo con /e/ en porcentajes
Efectivamente, se observa un favorecimiento por parte de los hombres en todos los
niveles educativos, aunque en el universitario la diferencia no es muy grande. Nótese
también que a mayor nivel educativo, mayor producción de diptongos con deslizada
media tanto por hombres como por mujeres.
133
4.2.3 Variante formación de diptongo con deslizada alta
Total N: 240/1151 Input 0.122 Log likelihood = -483.654
Probabilidad % diptongos /j/ Total N % Datos

Acento
V2 .75 32 617 54
V3 .50 15 264 23
V1 .07 1 270 23
Rango: 74
Edad
56-65 . 64 32 144 12
25-35 .53 23 341 30
36-55 .49 20 334 29
18-24 .40 15 332 29
Rango: 24
Nivel educativo
Primaria y secundaria .58 28 427 37
Preparatoria .49 19 332 29
Universidad .40 14 392 34
Rango: 18
Tipo de sílaba
Abierta .55 24 796 69
Cerrada .37 14 355 31
Rango: 18
Sexo
Mujer .57 25 604 53
Hombre .42 16 547 47
Rango: 15
Tabla 16. Factores que contribuyen a la selección de la variante /j/ (diptongo con deslizada alta)
La estrategia formación de diptongo con deslizada alta resultó ser la tercera más usada
por la muestra de este estudio. Con esta variante se identificaron también factores
externos y internos que condicionan esta estrategia. Entre las variables lingüísticas
tenemos el acento y el tipo de sílaba, mientras que entre las externas se incluyen la edad,
el nivel educativo y el sexo.
134
Analizando los factores internos, se observa que el acento en la segunda vocal de la
secuencia favorece mucho la presencia de esta estrategia en cuestión. También el acento
en una tercera vocal parece mostrar esta tendencia, aunque su peso es menor que el de la
segunda vocal. Dentro del tipo de sílaba, son las abiertas las que favorecen la
diptongación con deslizada alta. La tabla siguiente muestra la distribución entre estos
últimos factores:
Relación acento y tipo de sílaba

Total de observaciones : 1151 Valor de aplicación: /j/
N % N % N % N %
V1 V2 V3 Datos %
Cerrada 1/142 1 50/213 23 0 0 355 31
Abierta 2/128 2 147/404 36 40/264 15 796 69
Tabla 17. Variables vocal siguiente y tipo de sílaba
En realidad, la producción de diptongos con alta cuando el acento subyacente recae en la
V1 es casi nula independientemente del tipo de sílaba. Cuando la V2 es tónica, tenemos
un mayor número de observaciones, pero es la sílaba abierta la que favorece esta
estrategia. Cuando el acento se ubica en una tercera vocal, sólo se registraron casos con
sílaba abierta porque no tenemos secuencias vocálicas derivadas de verbos –ear en este
contexto y en sílaba cerrada. De ahí que las sílabas abiertas aparezcan como las
favorecedoras.
En cuanto a los factores externos, el grupo etario de 55-65 muestra el mayor peso,
seguido del grupo de 25-35 años, favoreciendo esta estrategia. Le siguen los subfactores
135
de primaria y secundaria, y las mujeres, en general. Abajo se presentan las relaciones
entre estas variables.
Relacion edad y nivel educativo
40
35
30
25
Porcentaje
Universidad
20 Preparatoria
15 Primaria y secundaria
10
5
0
18-24 25-35 36-55 56-65
Grupos etarios
Figura 32. Relación edad y nivel educativo con /j/
En efecto, se observa que el grupo de primaria y secundaria presenta los mayores
porcentajes de producción de esta variante /j/ en todos los grupos etarios en comparación
con los otros niveles educativos. En realidad, la tendencia parece ser que a menor nivel
educativo, mayor número de casos de deslizada alta, aunque esto no es contundente
porque no se contaron con informantes de preparatoria de 56-65 años y en el grupo de 18-
24, los del nivel de universidad producen ligeramente más esta variante que los de
preparatoria.
Comparando esta variante en los niveles educativos y los diferentes grupos etarios, se
advierte que las personas con universidad y posgrado no muestran gran variación de un
136
grupo etario a otro y tampoco hay un patrón de crecimiento o decremento. En el caso del
nivel preparatoria, los más jóvenes (18-24) producen menos que los otros grupos, pero es
el de 25-35 el que destaca con más ocurrencias. Con el nivel primaria, sucede algo
similar, pero con una variación: los grupos que más producen diptongos con alta son el de
25-35 y el de 55-65. En general, se nota que a mayor edad, hay más presencia de
diptongos con deslizada alta.
Analizando las variables sexo y nivel educativo, presentamos la siguiente tabla:
Relación sexo y nivel educativo

Total de observaciones con valor de aplicación /j/ : 1151
N % N % Datos %
Mujeres Hombres Totales
Universidad 30/185 16% 27/207 6% 392/34%
Preparatoria 43/174 25% 21/158 13% 332/29%
Primaria y sec. 80/245 33% 39/182 21% 427/31%
Totales 153/604 21% 87/547 16%
Tabla 18. Variables sexo y nivel educativo con /j/
Las mujeres favorecen más esta variante que los hombres en general en todos los niveles
educativos. De hecho, se nota también que, en el caso de las mujeres, la producción de la
deslizada alta se incrementa conforme el nivel educativo baja. Es decir, hay una relación
inversa: a mayor nivel educativo, menos diptongos con alta; pero a menor nivel, más
casos de /j/. Con los hombres, la situación es un poco diferente: su uso de esta estrategia
es igual en los niveles de preparatoria y universidad, pero ésta es mayor en el nivel de
137
primaria y secundaria. Así se confirma que es el nivel de primaria y secundaria con
ambos sexos el que produce más diptongos con deslizada alta.
Finalmente veamos qué ocurre con las variables sexo y edad a través de la tabla aquí
abajo:
Relación sexo y edad

Total de observaciones : 1151 Valor de aplicación: /j/
N % N % N %
Mujeres Hombres Totales datos

18-24 27/174 16 22/158 14 332 29
25-35 60 /184 33 18/157 11 341 30
36-55 45/188 24 22/146 15 334 29
56-65 21/58 36 25/86 29 144 12
Tabla 19. Variables sexo y edad con /j/
Una vez más se confirma que las mujeres favorecen más que los hombres, pero aquí
conviene notar que en el grupo de 18-24 la diferencia entre hombres y mujeres es
mínima. Sin embargo, ésta se va incrementando según aumenta la edad. El mayor margen
se presenta en el grupo de 25-35 en el que la diferencia entre mujeres y hombres es del
22%. Cabe señalar también que la producción de esta estrategia en los hombres es mayor
en el grupo de 56-65, igual que ocurre con las mujeres. Así, ambos sexos se comportan
de manera similar: los más jóvenes producen menos; el grupo de los mayores producen
más deslizadas altas.
Finalmente, veamos la relación entre las variables acento (lingüística) y el nivel
educativo (social):
138
Relacion acento y nivel educativo
50
40
30 Prim. y sec.
20 Preparatoria
10 Universidad
0
V1 V2 V3
Figura 33. Relación acento y nivel educativo con variante /j/
Sin considerar el acento en la V1, la gráfica muestra una clara estratificación por nivel
educativo cuando el acento está en V2 y V3. Es decir, en ambos contextos se evidencia el
determinante papel del nivel educativo en la producción de esta variante. Con la V2 todos
los niveles educativos producen más /j/ que con la V3, pero cada nivel educativo
mantiene la misma jerarquía constante con respecto a los otros grupos en los diferentes
contextos: a mayor nivel educativo, menor número de /j/.
4.2.4. Variante elisión
Se registraron sólo 101 casos de elisión y la prueba arrojó tres variables lingüísticas y una
externa como condicionantes de la variante de elisión. Sin embargo, dado que se
observan algunos traslapes e inconsistencias en la prueba estadística, trataremos esta
variante más con un carácter cualitativo. Entre los internos, el que registra un mayor peso
es la calidad de la vocal siguiente seguido del acento y del tipo de sílaba. Como factor
externo, la prueba de transformación resultó favorecer esta estrategia. De esta manera,
139
resulta que la /e/ es la vocal siguiente que favorece enormemente la elisión. Esto significa
que, dado que en los verbos –ear la primera vocal es /e/, ante otra vocal de igual calidad,
la tendencia es a elidir una de ellas. Cabe aclarar aquí que aunque hablamos de elisión, en
la mayoría de los casos (90%) lo que se observó fue un alargamiento vocálico de /e/.
El acento una vez resultó ser un factor determinante en la selección de estrategias de
resolución. En el caso de elisión, ocurre que el acento en la tercera vocal favorece dicha
estrategia. Y en el tipo de sílaba, la cerrada tiene un peso significativo.
La vocal /e/ destaca sobre manera en comparación con las otras vocales produciendo
casos de elisión cuando le sigue a la /e/ de los verbos –ear y cuando la V2 es tónica. Es
decir, se entiende entonces que la vocal elidida es la primera /e/ que es átona. De hecho,
en los pocos casos registrados de elisión con las vocales /a o/ la vocal elidida fue en todos
los casos la /e/ de la base del verbo -ear. Dado que la V1 fue arrojada como knock-out por
el programa de GoldVarb, se entiende entonces que cuando la V1 es tónica se inhibe esta
estrategia.
4.2.5 Variantes hiato con vocal alta /i/ y fusión
Las estrategias hiato con /i/ y fusión registraron un porcentaje tan bajo (2% y 1%,
respectivamente) que resulta insuficiente para derivar tendencias o probabilidades. Sin
embargo, podemos señalar que sobre la producción de hiatos con /i/, las observaciones
computadas se asocian con los niveles educativos más bajos y con mujeres.
Con respecto a la fusión (del contacto de las vocales los hablantes realizan otra vocal
distinta de éstas), es conveniente aclarar que las vocales o resultantes eran vocales
difíciles de clasificar porque no se correspondían con las vocales subyacentes; es decir, se

140
trata de vocales que requieren un estudio acústico y espectrográfico detallado para poder
clasificarlas. Esta estrategia parece realizarse más cuando el acento se ubica en la tercera
vocal, y que son los verbos en participio, futuro, imperfecto e infinitivo donde se
evidencia el uso de la elisión.
Hasta aquí hemos presentado cada una de las estrategias de resolución empeladas por los
informantes en este estudio. Concentrándonos en las más relevantes, abajo se ilustra
comparativamente cada una de estas estrategias con los factores condicionantes de cada
una de ellas:
141
Variables Hiato con /e/ Diptongo con Diptongo con
media alta
Acento
V1 .97 .12 .07
V2 .27 .75
V3 .19 .50
V2 y V3 .64
Rango: 78 Rango: 52 Rango 74
Edad
18-24 .57 .57 .40
25-35 .37 .54 .53
36-55 .51 .46 .49
56-65 .58 .31 .64
Rango: 21 Rango: 26 Rango: 24
Instrumento
Entrevista .30 .65
Sombreado .43
Transformación .52
Sombreado y .52
transformación
Rango: 22 Rango: 22
Nivel educativo
Primaria y sec. .40 .58
Preparatoria .47 .49
Universidad y .62 .40
posgrado
Rango: 22 Rango: 18
Sexo
Mujer .41 .57
Hombre .59 .42
Rango: 18 Rango:15
Grado de
sonoridad
Creciente .58 .60
Constante .38 .25
Rango: 20 Rango: 35
Tipo de sílaba
Abierta .55
Cerrada .37
Rango:18
Tabla 20. Tabla comparativa de estrategias con factores condionantes
142
Es de notarse que el acento es un factor presente en todas las estrategias y que en la
jerarquización de factores se encuentra en primer lugar. Distinguiendo la vocal que recibe
el acento, queda claro que cuando el acento recae en la V1, éste favorece casi
exclusivamente el mantenimiento del hiato, pues es la única variante constreñida por esta
condicionante. Por otra parte, si V2 es tónica, las estrategias probables son formación de
diptongo con deslizada alta seguida de diptongación con formación de deslizada media.
Finalmente, si la vocal acentuada es otra que no está en la secuencia vocálica (V3), hay
probabilidades de que ocurra cualquiera de las estrategias aquí analizadas, salvo el
mantenimiento del hiato.
La edad resultó ser uno de los factores sociales con mayor impacto en las estrategias,
pues está presente en las estrategias de mayor uso. En el mantenimiento del hiato se ubica
en el rango tres de cuatro; en diptongos con deslizada media está en el tres de seis, y en la
diptongación con alta es el segundo de cinco. Así, parece ser que en general la edad es un
factor externo con un papel determinante en la selección de una u otra estrategia. Si
analizamos con detalle, se observa que en el mantenimiento del hiato en general todos los
grupos favorecen esta estrategia excepto el grupo de 25-35 años; la diptongación con
deslizada media es principalmente acogida por los grupos etarios más jóvenes (18-35),
mientras que la diptongación con deslizada alta es favorecida principalmente por el grupo
más viejo, aunque también el grupo de 25-35 muestra esta tendencia.
El instrumento también es otro factor interno que afecta la resolución de hiatos, pues se
muestra como condicionante en el mantenimiento del hiato y en diptongación con
deslizada media. Hay, sin embargo, una ligera variación: las pruebas favorecen el hiato,
143
mientras que la entrevista favorece los diptongos con media. También la prueba de
transformación favorece esta estrategia.
El grado de sonoridad resultó relevante también en estas mismas estrategias de
resolución, aunque en jerarquías diferentes: en la heterosilabificación se ubica en la
posición cuatro, pero en la diptongación con media está en segundo lugar. Es la sonoridad
creciente la que favorece ambas estrategias.
Entre los factores sociales, también el nivel educativo parece tener efectos en la
resolución de hiatos. Se presenta en dos estrategias: formación de diptongo con media y
formación de diptongo con alta. En la primera, este factor ocupa la posición cinco de seis
en la jerarquía; en la segunda, es el tercero de cinco. Además de tener diferente rango en
la jerarquía, el nivel educativo integrado por tres subfactores: primaria y secundaria,
preparatoria, y universidad y posgrado parece dividirse en las estrategias. El grupo de
universidad y posgrado favorece la formación de deslizada con media mientras que el
grupo de primaria y secundaria favorece los diptongos con alta.
La variable sexo resultó condicionante en la formación de diptongo con media y con alta.
En ambas, se ubica en la última posición de la jerarquía de factores. Con esta variable se
observa un claro contraste en dichas estrategias: mientras los hombres favorecen los
diptongos con deslizada media, las mujeres muestran una tendencia a favorecer los
diptongos con deslizada alta.
Finalmente, el tipo de sílaba es un factor lingüístico que condiciona solamente la
estrategia de diptongación con deslizada alta, ubicándose en el penúltimo lugar en la lista
de factores. Son las sílabas abiertas las que favorecen esta estrategia.
144
En resumen, se advierte que estas estrategias están condicionadas tanto por factores
lingüísticos como sociales: el mantenimiento muestra dos de cada tipo; los diptongos con
media presentan más factores externos (4) que lingüísticos (2); y los diptongos con alta
también (3 externos y dos internos). Abajo presentamos un resumen de factores
jerarquizados para cada estrategia:
Hiato con /e/ Diptongo con media Diptongo con alta

1.Acento 1.Acento 1.Acento
2. Instrumento 2. Grado de sonoridad 2.Edad
3. Edad 3. Edad 3. Nivel educativo
4.Grado de sonoridad 4.Instrumento 4. Tipo de sílaba
5.Nivel educativo 5. Sexo
6. Sexo
Tabla 21. Resumen de grupos factoriales significativos por estrategia de resolución
En las páginas siguientes discutimos estos resultados en relación con los objetivos e
hipótesis planteados para este estudio.
4.3 Discusión de los resultados
Dado que uno de los objetivos de este estudio era identificar las estrategias usadas para
resolver los hiatos en los verbos –ear en español mexicano, los resultados arrojaron seis
estrategias en lugar de las cuatro planteadas inicialmente: mantenimiento del hiato,
formación de diptongo con deslizada media, formación de diptongo con deslizada alta,
elisión, hiato con /i/ y fusión vocálica. Como los resultados muestran, la estrategia de
145
resolución de hiato más utilizada en los verbos –ear por esta muestra fue la de formación
de diptongo con deslizada media, pero si la agrupamos junto con la diptongación con
deslizada alta, la suma se hace de 60%. Este resultado confirma nuestra hipótesis de que
la formación de diptongo es la resolución de hiato más utilizada en los verbos –ear en en
esta muestra estudiada, y coincide con el estudio de Perissinotto (1975) en la Ciudad de
México, con el de Jenkins (1999) en el español de Nuevo México y con el de Garrido
(2007) en el español caribeño colombiano, aunque estos estudios no se enfocaron
específicamente en las secuencias vocálicas de los verbos –ear.
No obstante las cifras de diptongación, el mantenimiento del hiato resultó la segunda
estrategia más utilizada con un 28%. Esto evidencia la tendencia antihiática de la que se
habla en la literatura, pero al mismo tiempo es un indicador de la resistencia a mantener
esta variante en determinados contextos. Vuskovich (2006) encontró en su estudio en la
Ciudad de México que el mantenimiento era la estrategia más usada seguida después de
diptongación tanto de media y alta, y después por elisión. Aguilar (2006) tuvo hallazgos
similares en el español peninsular: heterosilabificación seguida de diptongación y elisión
al final. Sin embargo, conviene aclarar que ambos fueron estudios en el nivel postléxico y
con diferentes secuencias vocálicas. Lo coincidente con estos estudios, además de con el
de Sanicky (1989), es que la estrategia de elisión es también la tercera en la escala de uso
en nuestra muestra, si agrupamos los diptongos. Para Jenkins (1999), la elisión se colocó
en segundo lugar y el mantenimiento del hiato en tercero en el español de Nuevo México.
La estrategia de hiato con /i/ parece ser novedosa porque no se han registrado casos en la
literatura. En realidad, en este estudio no se tenía planteada como variante, pero fue con
el análisis acústico que nos percatamos de su presencia. Aunque su producción es muy
146
reducida, ésta puede indicar algo: puede ser que los hablantes piensen que están usando
un verbo –iar en vez de -ear y después como hipercorrección hagan un hiato.
La fusión vocálica resultó ser la estrategia menos usada por nuestra muestra. En realidad
esta estrategia no ha sido reportada en estudios previos, con la excepción de Jenkins
(1999) en su estudio de Nuevo México. Aunque la registramos por tener varios casos,
este tipo de resolución de hiatos puede interpretarse también como resultado de la rapidez
del habla del informante o por una equivocada articulación de los segmentos que se da
por nerviosismo.
Nuestro segundo objetivo con este estudio era analizar los factores internos y externos
que condicionan las estrategias de resolución de hiato. En el análisis de resultados
arrojados por Goldvarb se jerarquizaron dichos factores según la estrategia empleada. El
acento resultó ser el factor de mayor peso en todas las estrategias, pero donde tiene un
papel fundamental es en el mantenimiento del hiato porque cuando la V1 es tónica, es
decir la /e/ del verbo, la probabilidad de mantener el hiato es casi total. Esto coincide con
la propuesta de Martínez-Gil (2000) y Morris (1998) de que en el dialecto mexicano las
vocales tónicas tienden a mantenerse como nucleares. Por otra parte, cuando el acento
recae en la segunda o tercera vocal, las probabilidades de usar otra estrategia de
resolución es muy grande. Estos resultados apoyan así nuestra hipótesis de que el acento
es la principal condicionante lingüística que inhibe la formación de diptongos, ya que las
vocales que reciben acento son más resistentes a los cambios. De hecho, cuando el acento
recae en la V2 o la V3, el cambio que se efectúa, ya sea por diptongación o por elisión,
generalmente ocurre en la vocal átona que en este caso es la /e/, la cual se vuelve
deslizada media o alta o se elide.
147
Pero entonces, la pregunta que seguramente surge es ¿por qué la V1 con la variante
mantenimiento del hiato no tuvo un cien por ciento? Esto sucede porque se registraron
casos de traslación o dislocación acentual (10%). Es decir, los hablantes cambiaron el
acento de V1 a V2 y recurrieron a otras estrategias de resolución. Por ejemplo, una forma
que presentó traslación acentual fue el verbo “parrandear” de presente en primera
persona. Así, en vez de decir “yo parrandeo por el boulevard”, algunos hablantes
terminaron diciendo “yo parrandeó por el boulevard”. Otro verbo también con cambio de
acento fue “besuquear” en presente en tercera persona de plural: “Mis amigos se
besuquean…”, el cual fue producido por algunos hablantes como una palabra oxítona en
vez de paroxítona. En consecuencia, estas dislocaciones acentuales causaron que ese peso
no fuera del 100%. Esta menor presencia de casos de traslación acentual confirma nuestra
hipótesis de que la traslación acentual en español mexicano no es favorecida. Además,
este resultado coincide con Morris (1998) y Martínez-Gil (2000) en su estudio
comparando el español chicano, mexicano y peninsular donde señalan que mientras que
la traslación acentual en el español chicano y el peninsular es posible, el español
mexicano no acepta tal cambio acentual. Sin embargo, tampoco podemos negar la
existencia de traslación acentual porque sí hay casos y esta variación puede ser el
principio de un cambio que afecte la reducción de la estrategia de mantenimiento del
hiato.
La variable calidad de las vocales no resultó un factor significativo, pero esto sucede
porque se observaron traslapes con las variables tipo de sílaba y grado sonoridad, que se
relacionan mucho. La vocal siguiente /e/, por ejemplo, resultó favorecer tanto los
diptongos con alta como la elisión. Este hecho de tener el mismo contexto fonético, pero
148
tener por lo menos dos posibilidades de resolución no coincide totalmente con lo que
ocurre en español chicano donde, según Martínez-Gil (2002) y Bakovic (2007), en el
nivel postléxico ante dos vocales idénticas sucede que una se elide. Más adelante, cuando
se aborden las variables sociales, ejemplificaremos este caso. Por ahora, podemos decir
que nuestra hipótesis sobre la calidad de las vocales: “en el caso de vocales idénticas en
contacto con los verbos –ear, no ocurre que una se elida; sino que formará diptongo”, se
confirma parcialmente porque es cierto que hay una gran probabilidad de que la
estrategia a usar sea la de diptongación con deslizada alta; sin embargo, también puede
ocurrir que se aplique la estrategia de elisión.
Pasando ahora a la variable tipo de sílaba, nuestros resultados muestran que este factor
sólo condiciona la diptongación con alta, pues las sílabas abiertas la favorecen. En las
otras estrategias este factor no tuvo un papel significativo, pero atendiendo este resultado,
se rechaza la hipótesis propuesta de que las sílabas abiertas favorecen el mantenimiento
del hiato.
El grado de sonoridad de las vocales subyacente resultó significativo en el mantenimiento
del hiato y en los diptongos con media. Ambas estrategias se favorecen si incluyen
secuencias con sonoridad creciente, pero la posición del acento es lo que marca
principalmente la gran diferencia del uso de una u otra estrategia. Cabe aclarar que el
grado de sonoridad usado en las pruebas estadísticas fue el de las vocales subyacentes, y
sólo con /a/ se tiene un grado creciente; con /e/ y /o/, el grado es constante. Sin embargo,
cuando se aplica la estrategia de diptongación o elisión, la secuencia de vocoides o el la
sílaba resultante producen una sonoridad creciente.
149
Esto es, si consideramos la escala de sonoridad propuesta por Jany et al (2007) y Núñez
Cedeño y Morales-Front (1999) en la que las deslizadas están en un nivel abajo de las
vocales, con estas estrategias se evidencia esta preferencia por secuencias de vocoides de
sonoridad creciente. Este favoreciemiento, sin emabrgo, está supeditado al acento, ya que
los hiatos, se mantienen aunque presenten una sonoridad constante o creciente. Estos
hallazgos conllevan a aceptar nuestra hipótesis de que en “español mexicano hay una
tendencia a evitar secuencias vocálicas con sonoridad constante; es decir, se prefiere una
secuencia vocálica cuyos elementos se distingan lo más posible en cuanto a sonoridad”.
En cuanto a las variables sociales, es claro que la resolución de hiatos en nuestra muestra
es un fenómeno condicionado socialmente, aunque llama la atención que unas estrategias
tienen más restricciones que otras. Es de notar que la edad es uno de los factores más
relevantes en este fenómeno. Estos resultados contrastan con los de Perissinoto (1975) en
la Ciudad de México, pues la edad no resultó significativa en su estudio. A grandes
rasgos en el presente estudio parece que los más jóvenes favorecen la diptongación con
deslizada media y los mayores, la diptongación con deslizada alta. El grupo de 25 a 35
muestra tendencias disímiles porque aunque es un grupo joven que también favorece los
diptongos con alta. Por otra parte, todos favorecen la retención del hiato, salvo dicho
grupo. Estos resultados también presentan grandes diferencias con respecto al estudio de
Vuskovich (2006) pues en éste las personas mayores produjeron más hiatos que los otros
grupos más jóvenes. Las diferencias encontradas con el grupo de 25-35 pueden
interpretarse también si miramos el nivel educativo y el sexo, que pueden estar
interactuando. Las mujeres en este grupo produjeron más diptongos con alta y también
los de niveles educativos bajos. Es decir, parece que en este grupo etario las mujeres de
150
niveles educativos bajos, pero quizás ya en el mercado lingüístico favorecen esta
variante.
En una visión global y prescriptiva, es evidente la variación existente en la resolución de
hiatos teniendo como variante estándar el mantenimiento del hiato y el resto como las no
estándar. Sin embargo, dentro de éstas se muestra una gradación de tendencias bien
diferenciadas tanto por factores lingüísticos como sociales o externos. En este grupo de
variantes “no estándar”, la formación de diptongo en general es la más favorecida,
seguida de elisión. De éstas, la diptongación es la más condicionada socialmente. Por
ello, nos enfocamos en la interpretación de esta variante y su función en la comunidad de
habla estudiada.
Como es bien sabido, la diptongación como estrategia de resolución ha sido documentada
repetidamente en estudios de dialectología o de pronunciación del español. No obstante,
al hablar de diptongación en estos textos es la deslizada alta [j] el vocoide al que se hace
referencia como resultado del contacto de vocales en las secuencias /e/ + V: [patjé],
[boltjó]. Es decir, basándonos en el registro desde hace mucho tiempo de la estrategia de
resolución mediante la diptongación con deslizada alta en la literatura, parece ser que fue
una de las que iniciaron el camino para evitar los hiatos. En el presente estudio, resulta
interesante que son las personas de edad mayor, las mujeres y los niveles educativos más
bajos (primaria y secundaria), los que favorecen esta variante. Tiene sentido entonces
pensar que son las mujeres las que lideraron o lideran aún esta variante como una
oposición al mantenimiento del hiato. Recordando que en algunos estudios se reporta que
incluso los hablantes cultos recurren a esta estrategia (Navarro Tomás, 1990; Matluck,
1995; Moreno de Alba, 1994), es probable que como variante innovadora, en su
151
momento, haya sido parte de un cambio promovido por las mujeres de los grupos medios
y después se haya difundido a los otros.
A pesar de ser una variante con gran frecuencia de uso, esta estrategia se ha identificado
en la literatura generalmente con gente rural o inculta por ser, obviamente, una variante
no estándar. Podemos suponer entonces que la formación de diptongo con media surge
como una estrategia intermedia entre la estándar (el mantenimiento de la secuencia
heterosilábica) y el diptongo con deslizada alta; es decir, ante una variante no estándar
que está siendo estigmatizada, hay una reacción para evitarla. Esto es lo que Chambers y
Trudgill (1980: 135) llaman una variante “fudge… a phonetic compromise between the
standard and the innovative variant that, in effect, allows users to avoid choosing between
them”.
De esta manera, tenemos que el nivel educativo más alto (universidad y posgrado) y los
hombres son los que favorecen esta nueva estrategia de resolución. Y es lógico pensar
que sea el nivel educativo más alto el que reacciona ante la estigmatización de la
diptongación con alta, pero lo interesante aquí es que la innovación se da con el
surgimiento de otra estrategia de resolución y no con el incremento de producción de
hiatos. Esto puede interpretarse como una preferencia antihiática en general, y el
mantenimiento de hiatos puede explicarse en términos lingüísticos, pues como lo indican
los resultados el acento en este dialecto desempeña una función fundamental y casi todos
los grupos etarios lo favorecen.
Volviendo a la variante de formación de diptongo con deslizada media, la variante
intermedia más reciente, podemos interpretarla en dos fases: primero surge como una
152
reacción contra la diptongación con alta en el nivel educativo alto liderada por hombres.
Y parece ser un cambio desde arriba o consciente. Como las gráficas claramente ilustran,
es una variante opuesta a la diptongación con alta la cual es favorecida por mujeres y los
niveles educativos bajos. Se observa que la diptongación con media es una variante
claramente estratificada, ya que la tendencia por esta variante se reduce de manera
constante según se baja en la escala de niveles educativos.
No obstante, esta estratificación no se muestra en el tipo de instrumento usado, pues la
entrevista y la prueba de transformación favorecen esta variante innovadora. Esta
situación parece indicar un uso generalizado o extendido en el habla de los informantes,
en los estilos o tipo de comunicación implicados en estos instrumentos. Es decir, tanto en
un contexto más natural (la entrevista) como en uno más artificial (la prueba de
transformación) los hablantes favorecen la deslizada media. La prueba de sombreado
desfavorece esta variante, pero suponer que es por una mayor atención o monitoreo no es
la mejor interpretación porque simplemente puede ser que los hablantes dividan su
producción entre otras estrategias y no únicamente entre la variante “estándar”. Esta
variante puede estar interactuando con los otros factores sociales.
Contrario a lo que sucede frecuentemente en la mayoría de los cambios lingüísticos en los
que la mujer es la líder, esta variante intermedia es promovida por los hombres en todos
los niveles educativos. Esto quizás pueda interpretarse mirando la situación
socioeconómica, cultural y geográfica de la comunidad de habla. El Estado de Quintana
Roo es un estado declarado como tal apenas hace 100 años y Chetumal, su capital, es por
tanto una ciudad relativamente joven que ha ido creciendo principalmente por la
constante llegada de inmigrantes procedentes de otros estados, principalmente de la
153
península de Yucatán en un principio, y en años más recientes de estados del centro del
país. Hace 18 años Chetumal no contaba con universidades y el único centro de
educación profesional era la Escuela Normal de Bacalar que formaba maestros de jardín
de niños y primaria. Por ello, sólo las personas con posibilidades económicas y
disposición para residir en otro estado, podían estudiar la universidad. Siendo una cultura
en la que no se acostumbra que los hijos vivan lejos de los padres y menos las mujeres,
parece ser que los hombres eran los que con más frecuencia se iban a otros estados a
estudiar el nivel superior. Esto se articula bien con el hecho de que para las entrevistas de
este estudio fue imposible encontrar mujeres arriba de los 50 años con estudios de
universidad y posgrado que hayan obtenido su grado universitario de jóvenes; hombres sí
se encontraron. De hecho, fue difícil también encontrar informantes (hombres y mujeres)
de nivel preparatoria del grupo etario 55-65, lo cual indica que hace 40 años la educación
en la ciudad no rebasaba quizás el nivel de secundaria o eran pocos los que continuaban
estudiando.
Tenemos entonces, por un lado, que los hombres eran los que en su mayoría salían a
estudiar a otros estados. Por otra parte, con la llegada de inmigrantes del centro del país
puede haber habido un encuentro de dialectos y de estrategias de resolución de hiatos.
Recientemente, la inmigración ha sido del centro del país y si recordamos el estudio de
Vuskovich (2006) donde se reporta que la estrategia de mayor uso, después del
mantenimiento, es la diptongación con deslizada media, podemos encontrar quizás una
conexión por aquí. También ocurre que con la apertura de la universidad pública y de
otras universidades privadas en fechas recientes, la contratación de profesores e
investigadores provenientes de otros estados también se ha incrementado. Las actividades
154
en el gobierno han aumentado y en los diferentes sectores públicos y privados también se
ha notado un incremento de contratación de personas inmigrantes que cuentan con
credenciales específicas para desempeñarse en tal o cual trabajo. De esta manera,
tenemos que los hombres que vuelven a Chetumal han tenido contacto con otros
dialectos, y los inmigrantes han traído su propio dialecto. Además, si consideramos que
en la Ciudad de México la formación de deslizada es la estrategia de resolución de mayor
uso (después del mantenimiento del hiato) liderada por hombres, como Vuskovich (2006)
señala, puede ser que ésta variante se esté difundiendo en otros estados pues esta ciudad
es la capital del país donde se concentran muchas universidades y centros culturales,
oficinas centrales de muchas instituciones y comercios, las principales televisoras y
radiodifusoras del país que transmiten al resto de los estados. Puede ocurrir que los
medios masivos de comunicación estén afectando o acelerando este cambio.
Por todo lo anterior, podemos suponer que esta estrategia de formación de deslizada
media es una variante que se ha difundido por diferentes medios y que ha sido promovida
por hombres en un nivel más “global”; es decir, la preferencia de las mujeres por la
variante diptongación con deslizada alta, que puede considerarse una variante local, no
coincide con la variante considerada en un nivel mayor, más global, como más
prestigiosa.
Hasta aquí tenemos la primera fase que mencionamos previamente: la diptongación con
deslizada media parece ser un cambio que llegó a ser una variante estable, pues muestra
correlaciones regulares con el nivel educativo ordenando su frecuencia de uso de acuerdo
con la jerarquización educativa; y hay diferencias entre mujeres y hombres.
Adicionalmente, con respecto a las evaluaciones subjetivas hacia esta variante, en general
155
parece haber una conciencia lingüística sobre esta diferencia de prestigio entre las
variantes de la diptongación.
Pero parece haber una segunda fase. En el presente estudio, la edad resultó uno de los
factores sociales más acusados en las estadísticas; es decir, fue el factor social que
condiciona casi todas las estrategias de resolución de hiatos y, como bien se sabe en la
literatura variacionista, la edad es el principal correlato social indicador de cambio
lingüístico. Los grupos más jóvenes (18-35 años) favorecen esta variante, pero si
revisamos la curva en la gráfica, ésta va en descenso conforme se avanza en edad. La
estratificación según el nivel educativo se mantiene constante, pero se correlaciona con la
edad también. En otras palabras, los niveles de primaria y secundaria y el de preparatoria
presentan una frecuencia de uso mayor de la variante innovadora conforme la edad se
reduce. El nivel de universidad tiene una frecuencia de uso mayor en los grupos de 25-35
y 36-55. Esto último puede interpretarse en términos de mercado lingüístico, pues es la
etapa de la vida productiva de los individuos en la que el uso de variantes de prestigio
tiene mayor cabida. Sin embargo, el grupo más joven (18-24) resultó también
favorecedor de esta variante.
Consecuentemente, parece ser que ya no estamos ante una variable estable y hay una
segunda fase, pues la frecuencia de uso entre jóvenes y personas mayores no es la misma
en el mismo nivel educativo. Generalmente, ante una variable estable, los informantes de
una misma clase social presentan la misma frecuencia de uso sin importar la edad, o las
diferencias son mínimas. Parece ser, por tanto, que estamos ante un cambio en curso en el
que las personas mayores registran en menor proporción la variante innovadora que los
informantes jóvenes. El aumento en el porcentaje de la variante formación de diptongo
156
con deslizada media entre los más jóvenes y la estratificación por edad opuesta que se
identifica en la variante diptongación con deslizada alta permite suponer un cambio en
marcha incipiente.
Pensamos que no se trata de un fenómeno generacional porque las frecuencias de uso de
la variante de los mayores no se mantienen en los jóvenes. Ante un cambio, la variante de
los padres se presenta en los hijos con mayor frecuencia y así sucesivas generaciones
muestran mayores incrementos en la variante innovadora. Tampoco suponemos que sea
una variable de gradación por edad porque son tres grupos etarios los que muestran altos
porcentajes de uso de la variante.
Finalmente, el hecho de que las mujeres de nivel educativo universitario y del grupo más
joven (18-24) mantenga casi la misma frecuencia de uso que los hombres de esos mismos
grupos puede interpretarse de dos formas: significa que es una variable estable y que en
los siguientes niveles la diferencia entre hombres y mujeres se hace más aguda, o que las
mujeres también están aceptando la variante innovadora y que en generaciones sucesivas
el número de mujeres produciendo dicha variante se incrementará en los siguientes
grupos etarios. Por toda la situación socio-económica, cultural, y demográfica de la
comunidad de habla, todo apunta hacia lo segundo apoyando nuestra suposición de un
cambio en marcha.
Comparando la variante de diptongo con deslizada media con la de diptongo con
deslizada alta, vemos una oposición regular. Las mujeres, el nivel educativo más bajo y el
grupo etario mayor favorecen la deslizada alta. Algo interesante aquí, sin embargo, es que
el grupo de 25 a 35 también parece favorecerla. La diferencia puede radicar en factores
157
lingüísticos más que en sociales. Si observamos bien los factores que determinan el uso
de uno u otro vocoide (medio o alto) son un tanto opuestos. El acento en la V3 tiene
mayor peso en la diptongación con media seguida de acento en V2, pero en la
diptongación con alta es la V2 tónica la que tiene mayor peso y después le sigue la V3
acentuada. Por otra parte, la vocal /e/ como vocal siguiente resultó favorecedora de la
diptongación con alta. Esto se traduce que en formas verbales con dos vocales idénticas
/e e/ hay una gran probabilidad de que la primera vocal se eleve y se forme una deslizada
alta en contacto con la otra vocal /e/, pues no encontramos deslizadas medias junto a una
vocal media idéntica en este dialecto.
Otra posibilidad de resolver el hiato de vocales idénticas /e e/ es mediante elisión, la cual
es favorecida casi totalmente por este tipo de secuencias. A diferencia del diptongo con
alta, el peso aquí es mayor cuando el acento recae en la V3 y cuando las sílabas son
cerradas. Pero las cosas no son tan sencillas porque se encontraron intersecciones en el
uso de estas dos estrategias. Por ejemplo, hubo hablantes que pronunciaban [patjé] y
otros [paté:]. Además, parece haber un efecto léxico también porque el imperativo plural
“cacheteemos” se realizó en un 90% con diptongo con alta por todos los informantes,
pero el imperativo singular negativo de “No zarandees” y “No chiquees” se produjo con
elisión un 90%. Las formas “coqueteé” y “golpeé” se produjeron con alta un 95%.
Estas diferencias pueden explicarse probablemente como efectos de frecuencia de uso
(Bybee, 2001). Si consideramos la frecuencia de ítem (token en inglés) y la frecuencia de
su tipo, en efecto los verbos que se realizaron con alta son mucho más frecuentes. Por
ejemplo, en el Corpus del Español de Davies (2002), golpear tiene una frecuencia de
16.7, mientras zarandear tiene 0.06. Por otra parte, las formas en pasado son más
158
frecuentes que las de imperativo. De acuerdo con Bybee (2001), los cambios fonéticos
ocurren más rápidamente con ítems de alta frecuencia que con ítems de baja frecuencia.
Ya Alba (2006) en su estudio de resolución de hiatos en el español de Nuevo México,
con un enfoque de fonología basada en el uso de Bybee, había encontrado que los
factores estructurales y de frecuencia desempeñan un papel significativo en la definición
de la resolución de hiatos, aunque su investigación fue en el nivel postléxico y con la
secuencia vocálica /a/ + V (cualquier vocal).
Con la selección de estrategia cuando tenemos dos vocales idénticas, por tanto, ocurre
que, por una parte tenemos los factores internos condicionando las estrategias, pero por
otro, tenemos los factores sociales en el caso de diptongo con alta, y además el efecto de
frecuencia de uso de los verbos. Los ítems de alta frecuencia probablemente se realicen
con diptongo con deslizada alta, y los menos frecuentes quizás pasen por un proceso de
elisión. El hecho de que los informantes de 25-35 años favorezcan la diptongación con
deslizada alta puede interpretarse como una forma en la que las mujeres, principalmente,
desean valorar la variante local, y dadas las condiciones estructurales propicias para
hacerlo, pues se crea esta tendencia. Este grupo puede conformarse de mujeres amas de
casa o estudiantes de posgrado, o personas activas en el mercado laboral que muestran
preferencia por la variante local.
Una estrategia que resultó inesperada, pero existente en la comunidad de habla, es el
mantenimiento del hiato con /i/. Igual que con la formación de diptongos con alta, las
mujeres favorecen esta estrategia y los niveles de primaria y secundaria y preparatoria.
Este fenómeno puede entenderse en términos de hipercorrección a favor de la variante
local, pero con mezcla de hipercorrección a favor del mantenimiento del hiato en vez de
159
la diptongación. El porcentaje de este fenómeno fue mínimo, pero es indicador de la
inestabilidad de las estrategias. En otras palabras, la gente produce o escucha formas de
verbos –ear con formación de deslizada alta [koketjé], [patjó] y puede pensar que son
verbos del tipo –iar y no –ear. En consecuencia producen todas las formas con diptongo
con alta. Pero hay algunos hablantes que inconscientemente saben que el hiato es la
forma prestigiosa y entonces realizan hiatos con alta. Este fenómeno puede estar
ocurriendo por ajustes en la conformación silábica de diptongos o hiatos; los hablantes
probablemente prefieren secuencias vocálicas de sonoridad creciente en vez de sonoridad
constante.
Esta estrategia de mantenimiento del hiato con /i/ parece lo contrario de otro fenómeno de
hipercorrección que, aunque no se presentó en los datos recogidos en la entrevista, sí se
escucha en algunos hablantes de la comunidad. Hay hablantes, sobre todo de niveles
medios bajos y medios que conjugan los verbos –iar como verbos –ear. Así, se escucha
“negocear” en vez de “negociar”, o “vacear” en vez de “vaciar”, “copear” por “copiar”,
entre otros. Parece ser que tras identificar la diptongación con deslizada alta en verbos –
ear como una variante no prestigiosa, de uso entre hablantes de nivel educativo bajo, o de
áreas rurales, los hablantes de niveles educativos medios y altos, o de clase media baja y
media -media tratan de evitar esa secuencia con deslizada alta y llegan al extremo de
suprimir esta estrategia de resolución que implica una alta incluso en los verbos donde la
forma estándar es un diptongo con deslizada alta, como es el caso de los verbos -iar. Este
fenómeno de hipercorrección demuestra el estado de conciencia que tienen los hablantes
ante la resolución de hiato con formación de diptongo con deslizada alta y cómo se ha
convertido o se está convirtiendo en un estereotipo.
160
Capitulo 5: Conclusiones y comentarios
5.1 Conclusiones
A través de este estudio se abordó el fenómeno de resolución de hiato en los verbos –ear
del español mexicano, en particular del español de Chetumal, una ciudad en el sureste de
México. En la literatura previa el fenómeno de la resolución de hiatos se ha abordado con
mayor frecuencia en el nivel postléxico y generalmente desde una perspectiva más bien
descriptiva, teórica o experimental, pero son muy escasos los estudios de hiatos en el
nivel léxico y con una perspectiva variacionista. De ahí la contribución del presente
estudio a la literatura.
Los objetivos planteados al inicio de este estudio fueron identificar las estrategias usadas
para resolver los hiatos en los verbos –ear en español mexicano y analizar los factores
internos y externos que condicionan dichas estrategias. Estudios previos sobre la
resolución de hiato se han enfocado principalmente en determinar las restricciones
lingüísticas en la resolución del hiato, las cuales se abordaron en el capítulo dos.
Obviamente, algunos de estos factores identificados en la literatura son aplicables sólo en
el nivel postléxico. Lo que la literatura en español sobre los hiatos no ha atendido en
general es la parte social, pues son casi inexistentes los estudios que incluyen variables
sociales. La tendencia ha sido investigar la velocidad o estilo como variable externa,
161
identificando mayor producción de hiatos a menor velocidad o con un estilo más formal
(más lento).
A partir de las estrategias y factores identificados en la literatura u observados en la
comunidad de habla, se postularon las hipótesis correspondientes. Para su comprobación,
se utilizó una combinación metodológica variacionista y fonética experimental, la cual
resultó apropiada pues permitió no tan sólo identificar las estrategias de resolución
existentes en la comunidad de habla, sino también analizar los factores lingüísticos
condicionantes de dichas estrategias y las restricciones sociales que afectan la resolución
de hiatos y los patrones de la variación existente. Dada la evidencia en la literatura sobre
la variación de la resolución de hiatos, este enfoque metodológico es apropiado para dar
respuesta a un fenómeno fonético en el que el significado lingüístico de la variable es el
mismo en sus distintas realizaciones (variantes) en la comunidad, pero éstas se constriñen
por factores internos y externos diferentes. El análisis cuantitativo de los estudios
variacionistas nos permite asimismo observar el efecto de los factores de manera
individual o simultáneamente. Además, por medio de análisis distributivos podemos
observar tendencias y patrones que conllevan al investigador a hacer las inferencias
pertinentes. Por otra parte, con el análisis acústico se establecieron correlatos acústicos
que facilitaron la identificación de la estrategia de manera más objetiva y precisa. Con
este estudio, fue posible una apertura a identificar cualquier estrategia y no limitarse a la
comparación de una o dos estrategias, lo cual nos permitió tener un panorama completo
del fenómeno. Los detalles metodológicos se presentaron en el capítulo tres.
162
En consonancia con la literatura, se identificaron casi las mismas estrategias, excepto el
hiato con /i/, pues ésta no se había establecido como una posible estrategia de resolución
en español. Por otra parte, si bien es cierto que la diptongación como estrategia de
resolución de hiato se ha reportado en diferentes dialectos del español desde hace ya
mucho tiempo, estos diptongos a los que se refieren implican un vocoide alto. Sólo
recientemente se ha empezado a discutir la presencia de diptongos con vocoides medios.
Sin embargo, el presente estudio es el primero en aportar evidencia empírica de
resolución de hiatos en el nivel léxico considerando ambas formas de diptongación (con
deslizada alta y media), entre otras estrategias, y factores sociales como educación, edad
y sexo, los cuales resultaron tener un papel fundamental en este fenómeno variable.
Además de establecer las estrategias de uso en la comunidad de habla estudiada, en esta
disertación se analizó la extensión de cada una de las variantes, así como las tendencias o
preferencias de los hablantes, las cuales se orientan en conjunto hacia la supresión de los
hiatos, siempre y cuando la vocal tónica no sea la V1 (la /e/ en este caso). Es decir, todo
parece indicar que en esta comunidad de habla se mantienen los hiatos por el relevante
papel que tiene el acento, pero la producción de estos hiatos se reduce al contexto de la
V1 como vocal tónica. Si comparamos el mantenimiento del hiato con las otras estrategias
de resolución, coincidimos con la sugerencia de Hualde y Chitoran (2007) de que el
español se encuentra en una etapa media en la evolución de los hiatos en dirección a la
diptongación. Esta comunidad de habla estudiada muestra tendencias antihiáticas que
apuntan hacia el favorecimiento de la diptongación principalmente, aunque también hay
otras estrategias como la elisión que contribuye a la supresión de hiatos.

163
Las inferencias obtenidas a partir de este estudio muestran diferencias con respecto a la
revisión de la literatura, en el sentido de que en ésta generalmente se contrapone el
mantenimiento del hiato a las formas de resolución que se desvían de la norma; es decir,
a las formas de resolución no estándar, a saber, diptongación, elisión, etc. Así, en la
literatura se habla de los porcentajes de hiatos vs. otras formas. Sin embargo, se ha
demostrado en este estudio que actualmente en esta comunidad de habla la competencia
más notable entre variantes se da entre dos tipos de resolución que no implican la
variante estándar, sino la estrategia de mayor uso: la diptongación. Es decir, el
antagonismo no se da entre la variante estándar y una no estándar, sino entre dos
variantes que se alejan de la norma.
Para estos hablantes, la diptongación como resolución de hiatos se ha vuelto la estrategia
de mayor uso, pero ha surgido un cambio que bifurca tal variante y la estratifica
socialmente. Es decir, en el fenómeno de resolución de hiatos sobresalen dos variantes no
estándares que parecen antagónicas y que están condicionadas en gran medida por
factores sociales. Por una parte, la formación de diptongo con deslizada media, es
favorecida por los hablantes de nivel educativo, jóvenes y hombres; por otra parte, los
diptongos con deslizada alta son favorecidos por los niveles educativos inferiores, las
personas mayores y mujeres.
Dado que la formación de diptongos con deslizada alta ha sido documentada como una
estrategia de resolución de hiatos desde hace mucho tiempo, y ha sido recientemente que
se ha señalado la posible diptongación con deslizadas medias, en este estudio concluimos,
164
considerando también la comunidad de habla y su conformación demográfica,
socioeconómica y cultural, que estamos ante un cambio en curso teniendo como variante
innovadora la formación de diptongos con deslizada media.
Sugerimos en este estudio que la diptongación con deslizada alta surgió como una
respuesta antihiática, la cual parece haber ser sido liderada por mujeres y por los grupos
educativos inferiores. Aunque esta estrategia mostró aceptación y avanzó hasta los
niveles educativos superiores, su prominencia como forma no estándar se hizo evidente
en la comunidad probablemente por los grupos cultos y su estigma empezó a expandirse
asociando esta variante con formas “coloquiales”, “vulgares”, o “rurales”, como se le ha
descrito en la literatura. Como reacción a esta variante estigmatizada, surge otra forma de
resolución de hiato que parece ser un punto intermedio entre la variante estándar y la
variante no estándar estigmatizada: la formación de diptongos con deslizada media.
Esta nueva variante es liderada por el nivel educativo superior, por hombres y jóvenes.
Tiene la ventaja de guardar más similitudes con la variante estándar, pues se mantiene la
calidad de la vocal, aunque su articulación varíe en cuanto a constricción o duración. Es
decir, parece ser que los hablantes distinguen perceptualmente entre una deslizada alta y
una media, y al mantener la media, se piense que se está más cerca de la forma estándar.
Esta resolución con la deslizada media guarda también semejanzas con la forma escrita y
parece no alterar las normas del registro oral o escrito. Por el contrario, con la
diptongación con deslizada alta, los hablantes cultos probablemente relacionan esta
estrategia con la alteración de la calidad vocálica, lo cual se refleja en la escritura al usar
165
el grafema <i> en las formas de los verbos –ear en vez de una <e> : patié, voltió,
coquetiar, etc.
Aunque a primera vista pareciera una variable estable que muestra simplemente
estratificación social, la diferencia entre los grupos etarios conlleva a interpretar el caso
como un cambio en marcha fuertemente avanzando por los jóvenes, grupo en el que la
diferencia entre sexos es inexistente. Apoyamos esta conclusión también en el análisis de
la comunidad de habla, la influencia de otros dialectos, y la posible difusión de esta
variante en un nivel macro. Vuskovich (2006) registró el uso de esta estrategia en el nivel
postléxico en la ciudad de México como la de mayor uso en la supresión de hiatos y
también encontró que los hombres favorecen esta estrategia. Proponemos así que estamos
ante un cambio en curso donde tenemos una variante local (diptongos con deslizada alta)
que covaría, con miras a ser reemplazada, con una variante global (diptongos con
deslizada media).
Esta disertación, por tanto, contribuye a la literatura variacionista al ofrecer una
descripción del fenómeno e intentar dilucidar las pautas de la variación y cambios
lingüísticos en el habla de esta comunidad de habla en particular. Sin un estudio de este
tipo, poco se puede saber sobre el tipo de variación al que nos enfrentamos con el
fenómeno de la resolución de hiatos. Por otra parte, este estudio también ofrece algunas
formas para la identificación de hiatos y diptongos, así como para la distinción entre
diptongos con deslizada alta o media.
166
5. 2 Futuros estudios
Dado que también se identificaron y jerarquizaron factores estructurales que afectan la
selección de determinada estrategia, las implicaciones de estos resultados en la fonética y
la fonología pueden ser varias. Sería conveniente definir la existencia de la deslizada
media anterior en otros contextos fonéticos en español y extender esta investigación con
la /o/, pues puede ser que también ocurran diptongos con la deslizada media posterior y
que no todos sean con /w/. Podrían también realizarse estudios de percepción de
diptongos con medias y con altas para investigar si los hablantes distinguen
auditivamente estos sonidos. De probarse cierto, significaría integrar las deslizadas
medias en el inventario de sonidos del español.
Por otra parte, el acento en la V1 resultó ser el factor principal que favorece el
mantenimiento de los hiatos. Coincidentemente, también se encontró que la traslación
acentual, por lo menos en este tipo de verbos, es casi inexistente. Este hecho es diferente
de lo que sucede en dialectos como el chicano y el peninsular en los que la dislocación
del acento es más permisible. Al respecto surgen varias preguntas que deberían atenderse,
por ejemplo, por qué existen estas diferencias, qué condiciona esta variación, y qué
efectos tiene en la lengua esta posibilidad de traslación acentual.
Entre los factores estructurales, la calidad de la vocal siguiente también fue significativa
junto con el tipo de sílaba. Por tanto, análisis de la estructura silábica en español y su
relación con el acento, el grado de sonoridad y la co-articulación podrían ser útiles para
entender las preferencias antihiáticas de algunas lenguas o dialectos. Las intuiciones de
167
los hablantes sobre la silabificación de palabras con secuencias vocálicas pueden ser una
fuente interesante de investigación. A través de un estudio dialectal comparativo se
podría pedir a dos o tres grupos de hablantes que silabificaran por escrito un número de
palabras con vocales adyacentes en hiato (prescrito como hiato por la norma estándar) y
posteriormente que leyeran estas palabras insertándolas en una frase con el mismo
contexto fonético para facilitar el análisis acústico y evitar efectos de los sonidos
adyacentes. De esta manera se podrían contrastar sus intuiciones con su producción y
saber un poco más sobre la construcción silábica en los hablantes.
El análisis acústico fue fundamental para este estudio pues a través de diferentes factores
como la duración, la pendiente total y parcial y su velocidad, la forma de la trayectoria
formántica, la tasa de crecimiento/decremento, y los valores de F1 y F2, se pudieron
identificar las estrategias y distinguir principalmente entre un diptongo y un hiato, y una
deslizada media y una alta, lo cual a veces no es muy fácil distinguir de manera
impresionista. Este trabajo en realidad fue arduo y complicado porque el análisis fue
individual por ítem y es muy difícil controlar el efecto de velocidad del habla de los
informantes. No obstante, considerando todos los parámetros antes mencionados, se pudo
determinar con bastante precisión la estrategia usada. En futuros estudios sería
conveniente considerar otros y diferentes contextos fonéticos de secuencias vocálicas y
establecer parámetros o correlatos precisos y generales, tratando de controlar las variables
de velocidad, efectos de co-articulación, duración intrínseca de las vocales implicada y el
acento, entre otros.
168
Con respecto a los instrumentos usados, aunque la entrevista sólo arrojó un centenar de
ítems, ésta tuvo una función muy importante en este estudio pues nos permitió escuchar
secuencias vocálicas en un contexto comunicativo más natural y espontáneo. En general,
se logró una buena interacción con los informantes y muchos de ellos se mostraron
cómodos y relajados al hablar. Además, fue útil para conocer más la comunidad, sus
costumbres y tradiciones, sus actitudes hacia los cambios en la ciudad, su visión de los
inmigrantes, los roles femenino y masculino, entre otros temas. De hecho, fueron las
entrevistas las que contribuyeron en gran medida a la interpretación de la variación del
fenómeno observado. Se obtuvo información de carácter cualitativo, que fue valiosa para
interpretar la variación en esta comunidad de habla.
Por otra parte, la prueba de sombreado y reconstrucción fonética arrojó muchos datos en
los que pudimos controlar el contexto fonético y facilitar el análisis acústico. Esta prueba
se usa generalmente en cursos de entrenamiento de intérpretes, pero en estudios donde la
lectura de palabras o textos puede influir en la pronunciación de la variable observada,
ésta puede ser una técnica muy útil. En nuestro caso, tratamos de evitar lo más posible
que los informantes vieran los verbos –ear por escrito porque esto podría concientizarlos
de la vocal implicada en la primera posición y suprimir realizaciones con deslizada alta.
Muchas personas con niveles bajos de educación pueden pensar que se trata de verbos –
iar y no –ear, pero si ven las palabras escritas, esto puede motivar formas diferentes. En
este estudio modificamos un poco la actividad agregando dibujos que facilitaban la
comprensión del contexto y la oración. De esta manera, con esta prueba, los informantes
escuchaban a una hablante de la comunidad con su mismo dialecto decir estas frases en
169
un tono natural y ellos sólo repetían. Dado que el ruido blanco cubría la secuencia
vocálica, los hablantes tenían que reconstruir el verbo apoyándose del contexto y de los
dibujos que se hicieron para acompañar la actividad.
Esta técnica de sombreado y reconstrucción fonética puede ser muy útil en estudios de
variación. Es importante integrar suficientes y variados distractores, así como por lo
menos dos frases para la práctica. Esto evita que los informantes se concienticen sobre la
variable en cuestión y monitoreen su habla. También se deben controlar los posibles
efectos que pueda tener el escuchar previamente y después repetir porque puede ser que
se imite la entonación, la velocidad, y obviamente la realización de la variable fonética
estudiada.
La prueba de transformación implicó necesariamente ver por escrito los verbos en
infinitivo, y por eso se dio al final. Con esta prueba los informantes se sintieron
evaluados en el uso de las formas verbales. Sobre todo las personas mayores y de niveles
educativos bajos, mostraban inseguridad y sentían la necesidad de confirmación por parte
de la entrevistadora. Con ellos, las frases de práctica fueron necesarias; con el resto, un
ejercicio era suficiente. Es una buena técnica que genera muchos ítems rápidamente. Sin
embargo, debe controlarse muy bien el contexto, tanto fonético como semántico, donde
estará el verbo, ya que de no hacerlo, los informantes pueden producir formas verbales no
deseadas, pero sí posibles en esos contextos. Por ejemplo, en este estudio ocurrió en
algunos casos que con el adverbio “mañana”, los informantes producían el futuro
perifrástico o analítico en vez del sintético, que es el que se pretendía motivar.
170
Las pruebas usadas en este estudio son rápidas, prácticas, fáciles de entender y hacer y
aunque principalmente con la prueba de transformación se sienten evaluados, piensan que
es la morfología verbal el punto de interés y eso funciona de distractor. A pesar de que
estas pruebas requieren de mucho trabajo por parte del investigador, valen la pena porque
redundan en muchas observaciones o tokens.
Para futuras investigaciones sobre resolución de hiatos, se podría usar un enfoque
fonológico basado en el uso o la frecuencia de uso, pero que integrara también variables
sociales, pues como se encontró en este estudio, este es un fenómeno condicionado tanto
lingüística como socialmente; es decir, es un fenómeno con una variación que presenta
patrones de orden estructural y social muy claros. Este estudio podría limitarse a los
verbos -ear o podría ampliarse a otra clase de palabras: sustantivos y adjetivos e incluir
secuencias vocálicas diferentes.
El fenómeno de la resolución de hiatos y su variación se evidencia incluso en la escritura.
Es común encontrar páginas en internet o en “chats” ejemplos de diptongación con
deslizada alta o de elisión. Y también es frecuente que los niños y adolescentes muestren
dudas o incertidumbre sobre cómo conjugar y escribir estos verbos. En novelas o cuentos
que tratan de reflejar la lengua vernácula de los personajes también se nota esta variante
de resolución. Por tanto, un estudio sobre los efectos de este fenómeno en la escritura
sería muy interesante y revelador, pues indicaría el grado de conciencia de los hablantes y
los cambios que se plasman en la lengua escrita. Podría conducirse un estudio con
informantes de diferentes edades y niveles de escolaridad. Se les puede dar unos dibujos
171
que ellos deben producir por escrito una frase con verbos –ear atendiendo el contexto que
observan en el dibujo. Una siguiente actividad puede ser darles una lista de frases, pero
en lugar del verbo tenemos también un dibujo o podemos incluir las primeras letras del
verbo como pista. Ellos deberán rellenar el hueco con el verbo adecuado. Con este
ejercicio podemos generar verbos en diferentes tiempos, personas, diferentes vocales,
tipo de sílabas y acento en distintas posiciones. Finalmente, podríamos pedirles que
leyeran estas últimas frases y se grabaría su producción oral para contrastarla con la
escrita.
Obviamente estudios de resolución de hiatos en el nivel léxico y con una metodología
variacionista en otros dialectos del español serían muy valiosos para lograr un panorama
completo del fenómeno en el sistema. A través de las divergencias o convergencias que
resulten, se podrían hacer predicciones más precisas de la situación del hiato en la lengua
española en relación con otras lenguas romances u otras lenguas en general.
172
Referencias
Aguilar, L. (1994). Los procesos fonológicos y su manifestación fonética en diferentes

situaciones comunicativas: la alternancia vocal/ semiconsonante/ consonante.
Tesis doctoral. Universidad Autónoma de Barcelona.
Aguilar, L. (1999). Hiatus and diphthongs: acoustic cues and speech situation differences.
Speech communication, 28(1), 57-74.
Aguilar, L. (2005). A vueltas con el problema de las semiconsonantes y las semivocales.

Verba, 32, 121-142.
Aguilar, L. (2006). A propósito de la combinacion de vocales. Nueva Revista de

Filología Hispánica , 54(2), 353-381.
Alarcos Llorach, E. (1995). Gramática de la lengua española. Madrid: Espasa Calpe.
Alarcos Llorach, E. (1971). Gramática estructural. Madrid: Gredos.
Alba, M. (2005). Hiatus resolution between words in New Mexican Spanish: A usage-
based account. Ph. D. Dissertation. The University of New Mexico.
Alba, M. (2006). Accounting for variability in the production of Spanish vowel

sequences. En N. Sagarra, & J. Almeida (Ed.), Selected Preceedings of the 9th
Hispanic Linguistics Symposium (pp. 273-285). Somerville, MA: Cascadilla
Proceedings Project.
Álvarez Nazario, M. (1990). El habla campesina del país. San Juan: Universidad de
Puerto Rico. .
173
Anttila, A. (2002). Variation and phonological theory. En J.K. Chambers, P. Trudgill &
N. Schilling-Estes (Eds.), The handbook of language variation and change (pp.
206-243). Oxford: Blackwell.
Avila, R. (1990). La lengua y los hablantes. México: Trillas.
Bailey, G. (2002). Real and apparent time. En J.K. Chambers, P. Trudgill & N. Schilling-
Estes (Eds.), The handbook of language variation and change (pp. 312-332).
Oxford: Blackwell.
Bakovic, E. (2007). Hiatus resolution and incomplete identity. En S. Colina & F.

Martínez-Gil (Eds.), Optimality-theoretic studies in Spanish phonology. (pp. 62-
73). Amsterdam: John Benjamins.
Barrutia, R. & Schwegler, A. (1994). Fonética y fonología españolas: teoría y práctica,

2nd. Ed. New York: John Wiley and Sons, Inc.
Bianco, V. (1996). The role of sonority in the prosody of Cowichan. Master’s Thesis.
University of Victoria.
Blevins, J. (1995). The syllable in phonological theory. En: John A. Goldsmith (Ed.), The
Handbook of Phonological Theory. (pp. 206-44). Oxford: Blackwell Publishers.
Boersma, Paul & Weenink, David (2008). Praat: doing phonetics by computer (Version
5.0.26) [Computer program]. Recuperado 16 de mayo de 2008, de
http://www.praat.org/
Borowsky, T. (1987). “Antigemination in English Phonology.” Linguistic Inquiry 18:

671-678.
Borzone de Manrique, A.M. (1979). Acoustic analysis of the Spanish diphthongs.

Phonetica, 36, 194-206.
Bybee, J. (2001). Phonology and language use. Cambridge: Cambridge University Press.
174
Cabré, T. & Ohannesian, M. (2007) The role of morpheme boundaries in Spanish glide
formation. En I. Gil, et al (Eds.) Cuadernos de Lingüística del I.U.I. Ortega y
Gasset, 14, (pp. 1-14). Madrid: Instituto ortega y Gasset.
Cabre, T. & Prieto, P. (2004). Prosodic and analogical effects in lexical glide formation
in Catalan. Probus, 16 (2), 113-150.
Canfield, Lincoln. (1981). Spanish Pronunciation in the Americas. Chicago: University

of Chicago Press.
Casali, R. F. (1996). Resolving hiatus. Ph.D. Dissertation, University of California, Los

Angeles.
Casali, R. F. (1997). Vowel elision in hiatus contexts: Which vowel goes? Language,
73(3), 493-533.
Catford, J. C. (1977). Fundamental problems in phonetics. Bloomington: Indiana

University Press.
Chambers, J., Trudgill, P. & Schilling-Estes, N. (Eds.). (2002). Handbook of Language

variation and change .MA: Blackwell.
Chambers, J. K. (2003). Sociolinguistic Theory: Linguistic Variation and its Social

Significance. Oxford: Blackwell.
Chambers, J.K. & Trudgill, P. (1998) Dialectology. Cambridge: Cambridge University

Press.
Chitoran, I. (2002a). A perception-production study of Romanian diphthongs and glide-

vowel sequences. Journal of the International Phonetic Association 32(2), 203-
222
Chitoran, I. (2002b). The Phonology and Morphology of Romanian Diphthongization.

Probus 14(2), 205-246.
175
Chitoran, I. (2001). The Phonology of Romanian: A Constraint-Based Approach. Berlin,
New York: Mouton de Gruyter.
Chitoran, I and J. I. Hualde (2007). From hiatus to diphthong: The evolution of vowel
sequences in Romance. Phonology 24(1), 37-75.
Chomsky, N.& Halle, M. (1968). The sound pattern of English. New York: Harper and
Row.
Clark, J,. Yallop, C. & Fletcher, J. (2007). An introduction to phonetics and phonology.
Malden, MA: Blackwell.
Clements, G. (1990). The role of the sonority cycle in core syllabification. En: John
Kingston and Mary E. Beckman (Eds.), Papers in laboratory phonology
1:between the grammar and physics of speech, (pp.283-333). Cambridge:
Cambridge University Press.
Clements, G. (2005). Does sonority have a phonetic basis? Comments on the chapter by
Vaux. En E. Raimy & C. Cairns, (Eds.), Contemporary Views on Architecture and
Representations in Phonological Theory. Cambridge, MA: MIT Press.
Clements, G, & Keyser, S. (1983). CV phonology: a generative theory of the syllable.

Cambridge, MA: MIT Press.
Coello Vila, C. (1996). Bolivia. En M. Alvar (Ed.). Manual de Dialectología Hispánica.

El español de América. (pp. 169-183). Barcelona: Ariel Lingüística.
Contreras, H. (1969). Vowel fusion in Spanish. Hispania, 52, 60-62.
Coren, A. & Warren, W. (2003). The importance of duration in the perception of glides
and vowels. Journal of Acoustical Society of America, 114(4), 2423-
Coren, A. & Warren, W. (2004). Duration as a cue in the distinction between glides and
vowels. Journal of Acoustical Society of America, 115(5), 2608-
Cressey, William. 1978. Spanish Phonology and Morphology: A Generative View.

Washington, D. C.: Georgetown UP.
176
Crystal, D. (1991). A dictionary of linguistics and phonetics. 3rd edition. Cambridge,
MA: Basil Blackwell.
Davies, Mark. (2002) Corpus del español (100 millones de palabras, siglo XIII - siglo
XX). Disponible en http://www.corpusdelespanol.org.
Cury-Lambraño, J. E. (2004). Costeñol versus español. Biblioteca Luis Ángel Arango:

http://www.lablaa.org/blaavirtual/modosycostumbres/cost/indi.htm
De Lacy, P. (1997). Prosodic categorisation. Master’s thesis. University of Auckland.

Rutgers Optimality Archive no. 236- 1297.
De Lacy, P. (2002). The formal expression of scales. Ph. D. Dissertation. University of

Massachusetts Amherst.
Deligiorgis, I. (1992). Maximality and glides. En M. Ziolkowski, M. Noske y K. Deatin

(Eds.) Papers from the 26th Regional Meeting of the Chicago Linguistic Society.
The parasession on the syllable in phonetics and phonology- 1990, 2, (pp. 81-95).
Chicago: Chicago Linguistic Society.
Deligiorgis, I. (1988). Glides and syllables. Ph. D. Dissertation. University of Iowa.
Diccionario Panhispánico de Dudas. (2006). Real Academia Española. Madrid:

Santillana.
D’Introno, F., Del Teso, E. & Weston, R. (1995). Fonética y fonología actual del
español. Madrid: Cátedra.
Eckert, P.(1997). Age as a sociolinguistic variable. En F. Coulmas (Ed.), Handbook of

Sociolinguistics, (pp. 151-67). Oxford: Basil Blackwell.
Eckert, Penelope (2000). Linguistic Variation as Social Practice: The Linguistic

Construction of Identity in Belten High. Oxford: Blackwell.
Eckert, Penelope (2005). Variation, convention, and social meaning. Paper Presented at
the Annual Meeting of the Linguistic Society of America. Oakland, CA.
177
Enciclopedia de los municipios de México. Quintana Roo. (1999) Centro Nacional de
Desarrollo Municipal, Gobierno del Estado de Quintana Roo. Recuperado el 15
de febrero de 2008
http://dzibanche.biblos.uqroo.mx/enc_munic_mex/quintanaroo/23000d.htm
Face, T. & Alvord, S. (2004). Lexical and acoustic factors in perceptions of the Spanish
diphthongs vs. hiatus contrast. Hispania, 87(3), 553-564.
Farrell, P. (1990). Spanish stress: A cognitive analysis. Hispanic Linguistics, 4 (1), 21-56.
Feagin, Crawford (2002) Entering the community: fieldwork. En J.K. Chambers, P.

Trudgill & N. Schilling-Estes (Eds.), The handbook of language variation and
change (pp. 20-39). Oxford: Blackwell Publishing.
Flórez, L. (1951). La pronunciación del español en Bogotá. Bogotá: Publicaciones del

Instituto Caro y Cuervo.
Frago Gracia, J. A. & Franco Figueroa, M. (2003). El español de América. Cádiz:

Servicio de Publicaciones de la Universidad.
García Fajardo, J. (1984). Fonética del español de Valladolid, Yucatán. México. UNAM.
Garrido, M. (2007). Diphthongization of Mid/Low Vowel Sequences in Colombian

Spanish. En J. Holmquist, A. Lorenzino & L. Sayahi (Eds.), Selected Proceedings
of the Third Workshop on Spanish Sociolinguistics. (pp.30-37). Somerville, MA:
Cascadilla Proceedings Project.
Grammont, M. (1933). Traité de Phonetiqué. Paris. Libraire Delagrave.
Harris, J.W. (1983). Syllable structure and stress in Spanish: a nonlinear analysis.
Cambridge, MA: MIT Press.
Hammond, R. (2001). The Sounds of Spanish: Analysis and Application. MA: Cascadilla
Press.
178
Henríquez Ureña, P. (1938). El español en Méjico, los Estados Unidos y la América
Central. Buenos Aires: Universidad de Buenos Aires.
Henríquez Ureña, P. (1976). Observaciones sobre el español en América y otros estudios

fonológicos. Serie Estudios lingüísticos y filológicos, 1, Buenos Aires: Academia
Argentina de Letras.
Hogg, R., & McCully, C. (1987). Metrical phonology. A coursebook. New York, New
York, USA: Cambridge University Press.
Hooper, J.B. (1976). An Introduction to Natural Generative Phonology. New York:

Academic Press.
Hualde, I. (1991). On Spanish syllabification. En H. Campos, & F. Martínez-Gil (Eds.),

Current Studies in Spanish Linguistics (pp. 475-493). Washington: Georgetown
University Press.
Hualde, I. (1994) La contracción silábica en español. En V. Demonte (Ed.) Gramática del

español (pp.629-647). México, D.F.: El Colegio de México.
Hualde, I., Olarrea, A., Escobar, A. M. (2001). Introducción a la lingüística Hispánica.

España: Cambridge University Press.
Hualde, I. & Prieto, M. (2002). On the diphthong/hiatus contrast in Spanish: some

experimental results. Linguistics, 40 (2), 217-234.
Hualde, I. (2005). The sounds of Spanish. Cambridge: Cambridge University Press.
Hualde, I., Simonet, M., & Torreira, F. (2008), Postlexical contraction of nonhigh vowels
in Spanish. Lingua, 118, 1906–1925.
Hutchinson, S. & Pinkerton. (1974). Spanish vowel sandhi. En A. Bruck, R. Fox & M.
W. La Galy (Eds.), Papers from the parasession on natural phonology, 184–192.
Chicago: Chicago Linguistic Society.
Hyman, L.M. (2003). A theory of phonological weight. CSLI.

179
Jakobson, R., Fant, G., y Halle, M. (1952). Preliminaries to speech analysis: the
distinctive features and their correlates. Cambridge: MIT.
Jany, C., Gordon, M., Nash, C., Takara, N. (2007). How universal is the sonority
hierarchy? A cross-linguistic study. En 16th International Congress of Phonetic
Sciences, 16, 1401–1404.
Jenkins, D. (1999). Hiatus resolution in Spanish: Phonetic aspects and phonological

implications from northern New Mexican data. Ph.D. Dissertation, The University
of New Mexico.
Jespersen, O. (1904). Lehrbuch der Phonetik. Leipzig and Berlin.
Johnstone, B. (2000). Qualitative methods in sociolingustics. New York: Oxford

University Press
Jones, D. (1918). An outline of English phonetics. (Reprinted 1956 (8th edition) New
York: E.P. Dutton and Co., Inc.
Kabak, B. (2007). Hiatus resolution in Turkish: an underspecification account. Lingua,

117(8), 1378-1411.
Kenstowickz, M. (1994). Phonology in generative grammar. Malden, MA: Blackwell.
Kirchner, R. M. (1998). An effort-based approach to consonant lenition. Ph.D.

Dissertation, UCLA.
Kirchner, R. M. (2001). Phonological contrast and articulatory effort. En L. Lombardi

(Ed.), Segmental phonology in Optimality Theory, (pp.79-117). Cambridge:
Cambridge University Press.
Kirchner, R. M. (2004). Consonant lenition. En Hayes, Kirchner & Steriade (Eds.),

Phonetically-based phonology, (pp.313-345). Cambridge: Cambridge University
Press.
180
Kiparsky, P. (1979). Metrical Structure Assignment is Cyclic. Linguistic Inquiry 10, 421-
441.
Labov, W. (1966). The social stratification of English in New York City. Washington,
D.C.: Center for Applied Linguistics.
Labov, W. (1972a). Hypercorrection by the lower middle class as a factor in linguistic

change. En Sociolinguistic Patterns. W. Labov (Ed.), (pp.122-42). Philadelphia:
University of Pennsylvania Press.
Labov, W. (1972b). Sociolinguistic Patterns. Philadelphia: University of Pennsylvania

Press.
Labov, W. (1994). Principles of Linguistic Change, Volume I: Internal factors. Oxford:

Blackwell.
Labov, W. 2001. Principles of Linguistic Change. Volume II: Social factors. Oxford and
Cambridge, MA: Blackwell.
Labov, W. et al. (2006). Listener’s sensitivity to the frequency of sociolinguistic

variables. Working papers in Linguistics 12(2), 105-129.
Ladefoged, P. (2001). A course in phonetics (4th Edition ed.). Boston, MA: Heinle &
Heinle.
Ladefoged, P. (2003). Phonetic data analysis. An introduction to fieldwork and

instrumental techniques. Oxford: Blackwell.
Levi, S. V. (2004). The representation of underlying glides: A cross-linguistic study. Ph.

D. Dissertation. University of Washington.
Levi, S.V. (2007). Phonemic vs. derived glides. Lingua. 1-23.
Levin, J.(1985). A metrical theory of syllabicity. Ph. D. Dissertation. MIT.
181
Lipski, J. M. (2006). El español de América. Madrid: Cátedra Lingüística.
Llisterri, J., Machuca, M., Mota, C. d. l., Riera, M., & Ríos, A. (2004). La percepción del
acento léxico en español. Recuperado el 2 de octubre de 2009, de
http://liceu.uab.es/~carme/Homenaje_Quilis04.pdf
Lope Blanch, J. M. (1996). México. En M. Álvar (Ed.), Manual de Dialectología

Hispánica, (pp. 81-87). Barcelona: Ariel.
Lope Blanch, J. M. (1983). Estudios sobre el español de México. México: Universidad

Nacional Autónoma de México.
Lope Blanch, J. M. (Ed.). (1972). Estudios sobre el español de México. Centro de

Lingüística Hispánica 2; México. UNAM.
Lope Blanch, J. M. (Dir.) (1990). Atlas Lingüístico de México. México, D.F.: El Colegio
de México. Centro de Estudios Lingüísticos y Literarios.
Maddieson, I., Emmorey, K. (1985). Relationship between semivowels and vowels:

cross-linguistic investigations of acoustic difference and coarticulation.
Phonetica, 42, 163-174.
Martinez-Celdrán, E. (1984). Fonética. Barcelona: Editorial Teide.
Martínez Celdrán, E. (1998). Análisis espectrográficos de los sonidos del habla. Madrid:
Ariel.
Martínez Celdrán, E. & Fernandez, A. (2007). Manual de fonética española. Barcelona:

Ariel.
Martínez-Gil, F. (2000). La estructura prosódica y la especificación vocálica en español:

el problema de la sinalefa en ciertas variedades de la lengua coloquial
contemporánea. En J. Gil Fernández, (Ed.), Panorama de la fonología española
actual. (pp. 511–560). Madrid: Arco Libros, S.L.
182
Matluck, J. (1951). La pronunciación en el español del Valle de México. México, D.F.:
Universidad Nacional Autónoma de México.
McCarthy, J. (1986). OCP Effects: Gemination and antigemination. Linguistic Inquiry,

17, 207-263.
Matluck, J. (1995). Hiato, sinéresis, y sinalefa: a sociolinguistic updating. En P.

Hashemipour, R. Maldonado, M.Van Naerssen (Eds.), Studies in language
learning and Spanish linguistics in honor of Tracy D. Terrell. (pp. 280-289). New
York: McGraw-Hill.
Méndez, José A. (1998) Stress and glides in Spanish syllable structure.Ph. D.

Dissertation. City University of New York.
Milroy, L. & Matthew, G. (2003). Sociolinguistics: method and interpretation. Oxford:

Blackwell Publishers.
Monroy Casas, R. (1980). Aspectos fonéticos de las vocales españolas. Madrid: Sociedad
General Española de Librería.
Montero, D. (2007). The perception of the acoustic correlates of stress: A cross-linguistic

study on English, French and Spanish. MA. Thesis. University of Washington.
Montes Giraldo, J.J. (1996).El palenquero, en M. Alvar (ed.). Manual de dialectología

hispánica: el español de América. (pp. 146-151). Barcelona: Ariel.
Morelli, F. (1999). The phonotactics and phonology of obstruent clusters in Optimality

Theory. Ph. D. Dissertation. University of Maryland.
Morén, B. (2001). Distinctiveness, coercion and sonority. A unified theory of weight.

Routledge: New York and London.
Moreno de Alba, J. G. (1994). La pronunciación del español en México. México. D.F: El

Colegio de México. Serie de Estudios de Dialectología Mexicana.
183
Morgan, T. (1984). Consonant-glide-vowel alternations in Spanish: a case study in
syllabic and lexical phonology. Ph. D. Dissertation, The University of Texas at
Austin.
Morris, R. (1998). Stylistic variation in Spanish phonology. Ph. D. Dissertation, The Ohio
State University.
Navarro Tomás, T. (1918): Manual de pronunciación española, Madrid: CSIC.
Navarro Tomás, T. (1966). Estudios de fonología española. Las Américas . New York.
Navarro Tomás, T. (1971). Manual de Pronunciación Española. Madrid: CSIC.
Navarro Tomás, T. (1990). Manual de pronunciación española, 24ª. ed. Madrid: Consejo
Superior de Investigaciones Científicas.
Núñez Cedeño, R. y Morales-Front, A. (1999). Fonología generativa contemporánea de

la lengua española. Washington: Georgetown University Press.
Ohannesian Saboundjian, M. (2004). La asignación del acento. Tesis doctoral.

Universidad Autónoma de Barcelona.
Padgett, J. (2008). Glides, vowels, and features. Lingua, 118(12), 1937-1955.
Paolillo, J. (2002). Analyzing linguistic variation: Statistical models and methods.

Stanford: CSLI.
Parker, S. (2002). Quantifying the Sonority Hierarchy. Ph. D. Dissertation. University of

Massachusetts Amherst.
Penny, R. (2000). Variation and change in Spanish. Cambridge: Cambridge University

Press.
Pérez Aguilar, R. A. (2002) El habla de Chetumal. Fonética, gramática, léxico indígena

y chiclero. Quintana Roo, México: Fondo Estatal para la Cultura y las Artes.
184
Perissinotto, G. (1975). Fonología del español hablado en la Ciudad de México: ensayo
de un método sociolingüístico. Trad. Raúl Ávila. México, D.F.: El Colegio de
México.
Picard, M. (2003). On the emergence and resolution of hiatus. Folia Lingüística

Histórica, 2003, 24( 1-2), 47-57.
Preston, D. R. (2002). Language with an attitude. En J. Chambers, P. Trudgill, & N.

Schilling-Estes (Eds.), Handbook of Language variation and change (pp. 40-66).
MA: Blackwell.
Prieto, M. (2002) Acoustic correlates of the syllable: Evidence from Spanish. Ph. D.
Dissertation. University of Illinois at Urbana-Champaign.
Prince, A. & Smolensky, P. (2004). Optimality Theory: Constraint Interaction in

Generative Grammar. Blackwell Publishers.
Quesada Pacheco, M.A. (1996). El español de América Central. En: M. Alvar (Ed.),
Manual de dialectología hispánica: el español de América. (pp. 101–115).
Barcelona: Ariel.
Quilis, A. (1993) Tratado de fonología y fonética españolas. Madrid. Gredos.
Reynolds, W. (1994). Variation and phonological theory. Ph.D. Dissertation, University

of Pennsylvania.
Rosenthall, S. (1994). Vowel/glide alternation in a theory of constraint interaction. Ph.D.

Dissertation. University of Massachusetts Amherst.
Rubach, J. (2002). Against subsegmental glides. Linguistic Inquiry, 33(4), 672-687.
Sands, K. L. (2004). Patternings of vocalic sequences in the world's languages. Ph. D.

Dissertation. University of California. Santa Barbara.
Sanicky, C. A. (1989). Las vocales en contacto en el habla de Misiones, Argentina.

Hispania , 72 (3), 70-704.
185
Sankoff, D., Tagliamonte, S., Smith, E. (2005). Goldvarb X: A variable rule application
for Macintosh and Windows. Department of Linguistics, University of Toronto.
Recuperado el 25 de junio de 2006
http://individual.utoronto.ca/tagliamonte/Goldvarb/GV_index.htm
Sausurre, F. de (1914). Cours de Linguistique Générale. Lausanne and Paris: Payot.
Schwegler, A. y Kempff, J. (2006). Fonética y fonología españolas. Wiley.
Sedano, M., Bentivoglio, P. (1996). Venezuela. En M. Alvar (Ed.). Manual de

dialectología hispánica: el español de América. (pp. 116–133). Barcelona: Ariel.
Selkirk, E. (1984). On the major class features and syllable theory. En: M. Aranoff and R.
T. Oehrle (Eds.), Language sound structure: studies in phonology presented to
Morris Halle by his teacher and students. (pp. 107-136). Cambridge,
Massachusetts: MIT Press.
Selkirk, E. (1982). The syllable. The structure of phonological representations. En H. van

der Hulst and N. Smith (Eds.), Advances in Nonlinear Phonology (part II).
(pp.337-83). Dordrecht: Fortis.
Senturia, M. (1998). A prosodic theory of hiatus resolution.Ph.D. Dissertation, University

of California, San Diego.
Shepherd. M.A. (2003). Constraint interactions in Spanish phonotactics: An optimality

theory analysis of syllable-level phenomena in the Spanish language. MA. Thesis.
California State University, Northridge.
Sievers, E. (1881). Grundzüge der Phonetik. Leipzig: Breitkopf and Hartel.
Silva-Covalán, C. (2001). Sociolinguística y pragmatica del español. Washington, D.C.:

Georgetown University Press.
Solé Sabater, M.J. (1985). Experimentos sobre la percepción del acento. Estudios de
Fonética Experimental, 1, 131-242.
186
Steriade, D. (1982). Greek prosodies and the nature of syllabification. Ph. D.
Dissertation. MIT.
Straka, G. (1964). A propos de la question des semi-voyelles. Zeitschrift fuer Phonetik

Sprachwissenschaft und Kommunikationsforschung, 17, 301-23.
Suárez Molina, V (1996). El español que se habla en Yucatán. Apuntamientos

filológicos. México: Edic. UADY.
Sweet, H. (1890) A primer of phonetics. (3rd edition 1906). Oxford: The Clarendon
Press).
Tagliamonte, S. (2006). Analysing sociolnguistic vaiation. Cambridge: Cambridge

University Press.
Trudgill, P. (1974). Linguistic change and diffusion: Description and explanation in

sociolinguistic dialect geography. Language in Society, 2, 215–246.
Trudgill, P. (2000). Sociolinguistics: an introduction to language in society. London.

Penguin.
van der Veer, B. (2006). The italian 'mobile diphthongs'. A test case for experimental
phonetics and phonology theory. Utrich, The Netherlands: LOT.
Vaquero, M. (1996). Antillas. En M. Álvar (Ed.). Manual de Dialectología Hispánica

(pp. 51-66). Barcelona: Ariel.
Vuskovich, M. (2006). A sociolinguistic perspective toward hiatus resolution in Mexico

City Spanish. MA Thesis. Louisiana State University.
Weinreich, U., Labov, W. & Herzog, M. (1968). Empirical foundations for a theory of
language change. En W. P. Lehmann & Y. Malkeil (Eds.). Directions for
historical linguistics: A symposium, (pp. 95-188). Austin: University of Texas
Press.
187
Williamson, R. (1986) El habla de Tabasco. Estudio Lingüístico. México. El Colegio de
México.
Yip, M. (1988). The Obligatory Contour Principle and phonological rules: A loss of
identity. Linguistic Inquiry, 19, 65-100.
188
Apéndice A: Protocolo de entrevista
A. Información demográfica
1. ¿Dónde nació? ¿Creció ahí o se fue con sus padres a otro pueblo/ciudad?
2. ¿Cuándo nació?
3. ¿Habla otra lengua además de español? ¿Cuál? ¿Qué lengua usan en casa?
¿Dónde aprendió español? ¿Cuándo? ¿Dónde y cuándo aprendió la otra lengua?
4. ¿En qué lugares ha vivido? ¿Dónde fue a la escuela?
5. ¿Es casado(a)? ¿Tiene hijos? ¿De dónde es su esposo(a)? ¿Es español su primera
lengua? ¿Cómo se conocieron?
B. Rutina y actividades diarias
¿Qué hace todos los días?
C. Niñez
1. Entre la edad de 10 a 15 años, ¿acostumbraba usted jugar con algún grupo de

niños de la colonia o del barrio? ¿Cómo eran? ¿Qué hacían juntos? ¿Cuál era su
juego/actividad favorito? ¿Cuál fue el problema más grande en el que se metió
cuando era niño?
2. ¿Qué hay ahora con los niños en este pueblo o ciudad?
3. ¿Qué presiones o problemas usted enfrentó de niño? ¿Cómo se comparan con los
problemas de los niños de hoy?
C1. Trabajo
1. ¿Cuál fue su primer trabajo?

2. ¿A qué se dedica actualmente?
3. ¿Qué hacen sus hijos?
4. ¿A qué se dedica la gente de la colonia o barrio? ¿Y en el pueblo o ciudad en
general?
189
C2. Escuela
1. ¿Dónde estudia? ¿Qué estudia?

2. ¿Por qué escogió esa carrera? ¿Qué va a hacer cuando termine de estudiar?
3. ¿Qué le gusta o disgusta de su escuela?
4. ¿Alguna experiencia divertida o diferente en la escuela?
5. ¿Qué hizo ayer después de la escuela? ¿Y hoy que hará?
D. Acerca del barrio o colonia/ pueblo o ciudad
1. ¿Se organizan algunas actividades aquí en la colonia, entre los vecinos? Fiestas
patronales, posadas, etc.
2. ¿Qué problemas tienen aquí en la colonia?
3. ¿Hay mucha gente que viene de otros estados o ciudades a vivir aquí? ¿Qué
piensa sobre esto?
4. ¿Qué piensa de la Plaza de las Américas? ¿Cómo ha afectado a Chetumal?
5. ¿Tiene amigos beliceños? ¿Por qué no? ¿Qué piensa de ellos?
E. Peligro de muerte
1. ¿Ha estado en una situación de peligro de muerte? ¿En una situación muy difícil?
F. Sueños
1. ¿Cuáles son sus sueños? ¿Qué es lo que usted sueña en la vida?
190
Apéndice B: Técnica de sombreado y reconstrucción fonética
Enunciados objetivo:
Presente
Yo bombeo de vez en cuando la tubería.
No es necesario que tú zarandees tanto al niño.
Tú chambeas tanto como yo.
Gloria capea poco a poco.
Estás buscando que te cacheteemos
Ana y yo cacheteamos a la vecina.
Mis amigos se besuquean donde sea.
Pretérito
Juan volteó todas las tortillas.
Ayer bombardearon la ciudad.
¿Dónde te golpeaste?
¡…pero yo la pateé con fuerza!
Futuro
Creo que chapearé la próxima semana.

191
Los manifestantes bloquearán la calle.
Todos plantearemos el problema.
Enunciados distractores:
Miguel corre en la bahía todos los días.
Nosotros comemos salbutes los fines de semana.
El bebé quería leche.
Yo no dije eso.
Harás lo que el médico te diga.
Enunciados de práctica:
Toño vino a verte.
Paty y yo haremos relleno negro.
192
Apéndice C: Prueba de transformación
Enunciados objetivo:
Presente
Yo siempre parrandear por el boulevard.
No quiero que tú chiquear tanto al niño.
Todos los sábados los niños chapotear en la alberca.
Nosotros nunca chatear por las mañanas.
Algunas veces tú me terapear muy bien.
¿Quieres que patear (yo) la pelota?
Pretérito
Ayer el niño golpearse con la pelota
La semana pasada las vecinas arguendear todo el tiempo
Anoche Ángel trapear con una camisa
Ayer yo coquetear con mi vecino/a.
Anoche tú golpear la puerta.
Futuro
Mañana yo estropear tus planes.

193
Mañana nosotros redondear el negocio.
El próximo domingo los chicos batear con todas las ganas.
Mañana por la mañana tú ondear la bandera
Enunciados distractores
Todos los lunes mi hermano cocinar frijol con puerco.
Ayer mis cuates y yo jugar dominó
Mañana por la mañana tú pagar el recibo de luz.
Algunas veces mis hermano llevar a su novia al cine.
El año pasado nosotros viajar a Cuernavaca.
Enunciados de práctica
Todos los años mi tía me regalar un libro
La próxima semana yo escribir una carta.
194
Apéndice D: Dibujos para la prueba de sombreado y
reconstrucción fonética
195
196
197
198
199
200
201
202
Apéndice E: The Ohio State University Consentimiento para
participar en la investigación
Resolución de hiato en verbos –ear del español

Título del estudio:
mexicano: un estudio sociofonético
Investigador: Terrell A. Morgan
Patrocinador: N/A
Esta es una forma de consentimiento de participación en la investigación, y contiene

información importante sobre este estudio y qué esperar si decide participar.
Su participación es voluntaria.
Revise la información con cuidado y siéntase con la libertad de hacer cualquier pregunta
antes de tomar una decisión sobre su participación o no en este estudio. Si decide
participar, se le pedirá que firme esta forma y le entregaremos una copia de la misma.
Propósito:
Nos interesa recolectar datos del habla de Chetumal e identificar si hay variación o no
con relación a otros dialectos (formas de hablar) en español. Se le está pidiendo su
participación en esta investigación porque como miembro de la comunidad es usted muy
valioso para la variación que pueda observarse. Se espera que cuarenta y ocho personas
participen en este proyecto.
Procedimientos/Actividades
Primero, tendremos una entrevista que incluye preguntas de la vida diaria, de

celebraciones o festividades en la ciudad, y de alguna anécdota que quiera compartir.
Después, tendremos dos actividades. En una de ellas, usted escuchará a una persona
diciendo algo y tendrá que repetir lo que escuchó. Puede escuchar una vez más si es
necesario. La segunda actividad es como un juego. Yo le voy a dar unas tarjetas con unas
203
palabras y usted va decir algo (una frase) con esas palabras. Tanto la entrevista como las
actividades son anónimas y serán audiograbadas. No tiene que darme sus datos
particulares; sólo necesito saber su edad y nivel de escolaridad.
Duración:
La entrevista durará treinta minutes y se espera que complete las actividades en treinta
minutes. Así, su participación en este estudio será de una hora aproximadamente. Usted
puede dejar el estudio en cualquier momento. Si decide dejar de participar en el estudio,
no habrá ninguna penalidad, y usted no perderá ningún beneficio que de otra forma usted
tendría. Su decisión no afectará cualquier futura relación con The Ohio State University.
Riesgos y beneficios:
No hay riesgos para los participantes. Usted no se beneficiará directamente por participar
en este estudio . Sin embargo, obtendremos una descripción de la variación en la lengua y
la compartiremos con los participantes que así lo deseen. Beneficios sociales de mayor
magnitud pueden incluir un mejor conocimiento de la situación lingüística y social de los
participantes, la cual puede ser útil para futuras investigaciones.
Confidencialidad:
Para este estudio no se requiere ni se registrar información personal, excepto sue dad y
nivel de escolaridad. Se harán todos los esfuerzos para mantener su información
relacionada con este estudio confidencial. Todos los registros de su participación no
tendrán forma de ser identificados y solamente el investigador principal y la co-
investigadora tendrán acceso a los datos.
Incentivos:
No recibirá pago alguno por su participación en este estudio.
Derechos de los participantes:
Usted puede rehusarse a participar en este estudio sin penalidad o pérdida de beneficios
que usted tiene de otra forma.
Si escoge participar en este estudio, usted puede terminar su participación en cualquier
momento sin ninguna penalidad o pérdida de beneficios. Al firmar esta forma, usted no
concede ningún derecho legal personal que usted puede tener como participante en este
estudio.
204
Un Equipo de Evaluación Institucional responsable de la investigación de sujetos
humanos en la Universidad Estatal de Ohio examinó este proyecto de investigación y
determinó que es aceptable de acuerdo con las regulaciones estatales y federales
aplicables y las políticas universitarias diseñadas para proteger los derechos y bienestar
de los participantes en la investigación.
Contactos y preguntas:
Si tiene preguntas, dudas o quejas sobre este estudio, puede contactar al Dr. Terrell A.
Morgan al teléfono (614) 292 -9555 o por correo electrónico a morgan.3@osu.edu, o a la
Mtra. Edith Hernández al (983) 83 503 00 Ext. 245 por correo electrónico a
hernandez.147@osu.edu
Si tiene preguntas sobre sus derechos como participante en este estudio o quiere discutir
alguna preocupación o queja con alguien que no es parte del equipo de investigación,
puede contactar a Ms. Sandra Meadows en la Oficina de Prácticas de Investigación
Responsable en Estados Unidos en el teléfono 1-800-678-6251.
Signing the consent form
I have read (or someone has read to me) this form and I am aware that I am being asked
to participate in a research study. I have had the opportunity to ask questions and have
had them answered to my satisfaction. I voluntarily agree to participate in this study.
I am not giving up any legal rights by signing this form. I will be given a copy of this
form.
Signature of subject
Printed name of subject
AM/PM
Date and time
205
Printed name of person authorized to consent for subject Signature of person authorized to consent for subject
(when applicable) (when applicable)
AM/PM
Relationship to the subject Date and time
Investigator/Research Staff
I have explained the research to the participant or his/her representative before requesting
the signature(s) above. There are no blanks in this document. A copy of this form has
been given to the participant or his/her representative.
Edith Hernandez
Printed name of person obtaining consent Signature of person obtaining consent
AM/PM
Date and time
206

Osu1262231085 PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Osu1262231085 PDF

Uploaded by

Copyright:

Available Formats

RESOLUCIÓN DE HIATOS EN VERBOS –EAR: UN ESTUDIO

SOCIOFONÉTICO EN UNA CIUDAD MEXICANA

Edith Hernández, M.A.

Graduate Program in Spanish and Portuguese

The Ohio State University

Professor Scott A. Schwenter, Advisor

Professor Terrell A. Morgan

Professor Rebeka Campos-Astorkiza

in hiatus resolution in –ear verbs in Mexican Spanish. Previous literature on hiatus

resolution suggests a tendency in many languages, including Spanish, to avoid adjacent

heterosyllabic vowels by employing different strategies to resolve hiatus. This array of

possibilities to deal with heterosyllabic vowel sequences could therefore yield a

heterogeneous variation showing both intra-speaker and inter-speaker variation.

own perception. On social grounds, some resolution strategies in Spanish, like

illiterate or from lower social classes.

This dissertation contributes to the literature on hiatus resolution in Spanish by describing

in Mexican Spanish. A variationist methodology along with an experimental approach

hiatus resolution is a linguistically and socially conditioned phenomenon. Stress was

glide. The persistence of different resolution strategies, in contrast to hiatus maintenance,

reconfirms the anti-hiatus tendency of Mexican Spanish.

people. I owe my deepest gratitude to my advisor, Scott Schwenter whose

enabled me to understand and become fascinated by linguistics. I am grateful for the

questions, comments and suggestions he offered me for my dissertation. His expertise

and insightful comments were a great contribution to this study.

phonetics and phonology. My gratitude also goes to Rebeka Campos-Astorkiza, for

por su colaboración y disposición. También a mi familia, gracias en especial a mi

hermana Griselda por su siempre apoyo y ánimo a la distancia. Y finalmente, gracias a

ayudarme a entender estadística.

1995……………….B.A. TEFL, Universidad Veracruzana

2000 ………………M. A. Teaching Spanish as a FL, Universidad de Alcalá de Henares

2006 ………………M.A, Hispanic Linguistics, The Ohio State University

Hernández Méndez E, (forthcoming). La enseñanza de la pronunciación. In R. Reyes

Hernández Méndez, E. (2008). Perspectivas y experiencia docente en la enseñanza de la

Hernández Méndez, E. & Bye, B. (2003). Los alternantes paralingüísticos en español.

Major Field: Spanish and Portuguese

Studies in: Sociolinguistics and Psycholinguistics

VITA ................................................................................................................................. vii

TABLE OF CONTENTS................................................................................................. viii

LIST OF TABLES............................................................................................................ xii

LIST OF FIGURES ......................................................................................................... xiv

CAPÍTULO 1: INTRODUCCIÓN ..................................................................................... 1

1.1 Panorama general ...................................................................................................... 7

CAPÍTULO 2: REVISIÓN DE LA LITERATURA Y MARCO TEÓRICO .................. 10

2.1 Resolución de hiato en español ............................................................................... 10

2.2. Variación en la resolución de hiatos en español .................................................... 17

2.2.1 Variación y factores externos ........................................................................... 17

2.2.2 Variación y factores internos ............................................................................ 23

2.3 Factores lingüísticos como condicionantes de la resolución de hiatos ................... 35

2.4.1 Vocales y deslizadas desde un punto de vista fonético .................................... 38

2.4.2 El caso de las deslizadas medias...................................................................... 44

2.4.3 Vocales y deslizadas desde una perspectiva fonológica................................... 55

2.5 Sonoridad y resolución de hiatos ............................................................................ 61

2.6 Acento y resolución de hiato ................................................................................... 70

2.6.1 La función del acento en la resolución de hiato ............................................... 72

CAPÍTULO 3: MÉTODO, VARIABLES E HIPÓTESIS................................................ 76

3.1 Teoría de la variación y metodología variacionista ................................................ 76

3.2 Método experimental............................................................................................... 79

3.3 Definición de variables............................................................................................ 80

3.3.1 Variable lingüística dependiente y sus variantes.............................................. 80

3.3.2 Las variables lingüísticas independientes......................................................... 81

3.3.3 Variables externas independientes.................................................................... 83

3.4 Definición de contextos lingüísticos de la variable: e + V...................................... 91

3.6 Sujetos ..................................................................................................................... 93