Cómo crear un lenguaje

por Pablo David Flores basado parcialmente en el Language Construction Kit de Mark Rosenfelder [Pueden bajarse todas las páginas de Cómo crear un lenguaje en un archivo .zip para leerlas offline, sin incluir gráficos ni sonidos. También existe una versión  consolidada que se puede leer online y es un poco más apta para imprimirse, aunque no lo garantizo.] Estas páginas están orientadas a gente interesada en crear lenguajes para propósitos de ficción (o sólo por diversión) y en la lingüística en general. No pretenden ser un  curso de lingüística en línea, pero seguramente podés aprender algunas cuantas cosas de lingüística leyéndolas, de la misma forma que yo, no siendo un lingüista,  aprendí de otros. Tampoco se supone que sean una guía para crear lenguajes auxiliares o internacionales como el Esperanto. Estas páginas se dividen en dos campos principales: sonidos (fonología) y estructura (gramática). Cubrirán ambos campos, en ese orden, y muchos otros que están de  alguna forma en medio. También se explicarán los términos técnicos lingüísticos que se usen. Antes de empezar, me gustaría darle el crédito merecido a Mark Rosenfelder, quien me dio mi primera herramienta para ponerme a desarrollar lenguajes seriamente.  La estructura y los puntos principales de estas páginas están basados en su trabajo, aunque he tratado de no copiar todo (lo cual hubiera sido bastante tonto de mi  parte), sino, en cambio, dar algún consejo y entrar en mayor profundidad en detalles que él no menciona en su Language Construction Kit. Algo de material, especialmente en la sección de Cambio de Sonidos, también se ha sacado de la newsletter Model Languages, de Jeffrey Henning. Colegas creadores de lenguajes y amables lectores sugirieron muchas correcciones y añadiduras a la versión original de este documento. Algunas explicaciones han sido adaptadas de mensajes a la lista  CONLANG. ¡Gracias a todos! He mencionado y/o usado ejemplos de una buena docena de lenguajes, tanto naturales como ficcionales, estos últimos creados por mí y por otros. He intentado ser  tan exacto como fuera posible; todo depende de mis fuentes, algunas de las cuales son libros que alguna vez tomé de una biblioteca y que ya he devuelto, por lo cual  debo citar de memoria. Esto debería explicar la naturaleza dubitativa de alguna que otra afirmación. No obstante, tengo buena memoria y creo que cada cosa que he  escrito es correcta hasta donde sé. No he incluido conjeturas que no estén explicitadas como tales. Si alguien encuentra un error, o algo que parezca ser un error, o desea hacer una sugerencia, o quiere que se discuta un tema en particular (o enseñarme sobre él), por  favor escríbame. Adiciones y correcciones son bienvenidas. Estas páginas no requieren para su visualización de ningún aditamento avanzado (Flash, Shockwave, ni siquiera Java). Se recomienda un navegador con capacidad  para entender la especificación de hojas de estilo en cascada (Cascaded Style Sheets - CSS); en general todos los navegadores modernos (incluso los más  defectuosos, como el ubicuo Microsoft Internet Explorer) soportan esta especificación hasta donde se requiere. Los navegadores más antiguos mostrarán estas  páginas con otro formato, pero el contenido se preservará. Aunque no se requiere, estas páginas son compatibles con Opera, que con su soporte de ciertas innovaciones estándar permite una navegación más sencilla. En algunos lugares se ofrecen muestras de sonido en formato MP3, que fue elegido por producir archivos de audio muy compactos y que se pueden escuchar, grabar y/o modificar con herramientas al alcance de cualquiera. Estas muestras no son indispensables para la comprensión del resto del contenido.

Sonidos
Los sonidos son la forma en que un lenguaje se vuelve real en el mundo físico, así que comenzaremos hablando de ellos. Algunas personas creen que una letra en su  alfabeto es lo mismo que un sonido, o que todos los sonidos de todos los lenguajes del mundo son los mismos (que los sonidos de su propio lenguaje), sólo que con  'acentos' diferentes. Por qué esto es falso se puede explicar fácilmente y ser entendido por la mayor parte de la gente. Aquí no mezclaré sonido con representación o  transliteración, y daré ejemplos de sonidos en lenguajes que pueden resultar familiares sólo para simplificar las cosas. Sin embargo, tenemos que hablar primero de un tema bastante abstracto, para poder proseguir con confianza después. Hablaremos de fonos (sonidos reales) y fonemas (los sonidos en un lenguaje como los ve un lingüista).

Fonos y fonemas
El inmenso (de hecho, infinitamente denso) rango de sonidos posibles que un ser humano puede producir se llaman fonos. Cada posición particular de los labios,  lengua y otras características de nuestro órganos fonadores puede pensarse como un punto en un continuo multidimensional. Dadas dos posiciones de la lengua con  respecto al interior de la boca, siempre hay una posición en el medio, y así sucesivamente. Como los números reales en su recta. Sin embargo, agrupamos los sonidos en torno a ejemplos prototípicos de ellos mismos, para estudiarlos mejor y más fácilmente, y llamamos a cada uno un fono, un sonido simple (es decir, único) que se puede describir por ciertas características (por ejemplo, la lengua toca los dientes, las cuerdas vocales vibran, etc.). En un lenguaje dado, encontraremos muchos fonos, pero éstos no son el objeto de nuestro estudio. Necesitamos distinguir los sonidos que son distinguibles por los  hablantes del lenguajes, es decir, los que éstos conceptualizan como diferentes. Éstos se llaman fonemas. Un fonema puede pensarse como una familia de sonidos relacionados que los hablantes consideran como una misma unidad fonética. Los sonidos que forman parte de un mismo fonema se llaman alófonos o variantes alofónicas. En símbolos fonéticos, las transcripciones fonémicas se encierran entre barras (/X/), mientras que las fonéticas (aquéllas que distinguen los alófonos de un mismo  fonema) se encierran entre corchetes ([X]). Los símbolos fonéticos estándar que usa la mayor parte de la gente hoy en día pertenecen a un conjunto, el IPA (International Phonetic Alphabet, "Alfabeto Fonético Internacional"). Son muchos, y necesitarías una fuente especial para verlos si los usara aquí, así que yo (como  la mayoría de los que tienen que manejar símbolos del IPA en la Web o en e-mail) uso una transliteración que permite representar el IPA con caracteres ASCII de 7  bits, y que se llama X-SAMPA. Hay varios otros tipos de transliteraciones del IPA en ASCII. Para oír los sonidos del IPA, podés usar un programa, IPAHelp. De vuelta al tema... Los alófonos de un fonema no tienen por qué ser sonidos parecidos. Pueden serlo o no. Por ejemplo, en español el fonema /b/ tiene dos

alófonos, [b] y [B] (una fricativa bilabial, parecida a la v del inglés, donde se sopla aire entre los labios). Éstos son sonidos similares y relacionados. Por otro lado,  la /h/ japonesa tiene tres alófonos, [h], [C] (algo así como en huge en inglés, el Ich-Laut del alemán, o la j española ante /i/), y por último [p\] (como /f/, pero el aire soplado entre los labios, no entre labios y dientes). Éstos son sonidos bastante distintos entre sí. Lo que los hace alófonos es que los hablantes de japonés los  tratan como el mismo sonido (fonema). Notemos que, por ejemplo, en alemán [C] y [h] son alófonos de distintos fonemas, así que sí pueden distinguir palabras. Esto nos lleva a la principal característica de los alófonos: usualmente están en distribución complementaria. Esto significa que el alofóno dado de un fonema que  aparece en una posición particular depende de esa posición, la cual determina cuál fonema (uno y no otros) aparecerá. Volviendo a los ejemplos, en español /b/ es [b] después de /m/ y cuando comienza una palabra claramente (por ejemplo, al principio de una oración); de otra forma es [B]. No se puede tener [mB] o [ab], ya que solamente [mb] y [aB] son posibles. Esto se reduce al hecho que define qué son los fonemas: sonidos que pueden distinguir palabras. Si dos sonidos son alófonos, no pueden producirse dos palabras  (distintas) intercambiándolos, porque de hecho son lo mismo; si pronunciás uno donde debería aparecer otro, sonará extraño o incorrecto a los hablantes nativos, pero  probablemente no oirán una palabra diferente. Vas a ver más de esto después, en otras secciones, ya que seguiré repitiéndome. Si no entendés el concepto de fonema, es mejor que sigas tratando.

Vocales y consonantes
Los sonidos usados en cualquier lenguaje se pueden dividir (generalmente) en consonantes y vocales. Esta división no es necesariamente univeral; en muchos  lenguajes algunas 'consonantes' como r, m, n, l, sirven de hecho como vocales (es decir, se las trata como núcleos de sílaba, pueden ser acentuadas or alargadas,  etc.). Por ejemplo, el sánscrito tiene l y r silábicas; y la n japonesa de final de sílaba es moraica (se pronuncia con longitud similar a una vocal, e influye en la métrica).  La división entre vocales y consonantes es un asunto de cierre: cuanto más cerrados están los pasajes respiratorios, más consonántico es un sonido. Vamos a examinar  los diferentes tipos de sonidos usando esta escala.

Consonantes
Los sonidos varían a lo largo de dimensiones. Éstas representan rangos de características posibles, o características binarias (de tipo sí/no). Cada lenguaje tiene una  fonología con una o más dimensiones dentro de las cuales se encuentran y reconocen sonidos. Una dimensión importante es el grado de cierre (u oclusión). De  acuerdo a esto, las consonantes se clasifican en:
l l

l

Oclusivas: el flujo de aire se detiene completamente por un instante, y luego se suelta, para producir el sonido. Los sonidos /p t b g/ son oclusivos. Fricativas: el flujo de aire no se detiene totalmente, pero causa una fricción audible. Por ejemplo: /f/, /s/, la j  española /x/ o la ch alemana, la sh inglesa (/S/), etc. Aproximantes: el flujo de aire apenas se modifica. Por ejemplo: /w l r/.

Además, una africada es una oclusiva más una fricativa, que ocurren en el mismo punto de articulación, como la ch española (que es /tS/, donde /S/ = sh), o la z alemana (que se pronuncia /ts/). Un click es un sonido producido colocando la lengua en posición para una oclusiva, mientras hay un segundo cierre del paso de aire en otro lugar (generalmente el  velo del paladar, donde se pronuncia /k/), acumulando presión y luego soltando el aire (ver abajo). También tenemos el punto de articulación, es decir, dónde ocurre la obstrucción del flujo de aire. De acuerdo a esto, las consonantes pueden ser:
l

l l l l

l l l l

Labiales: formadas por los labios (/m/, /p/, también conocidas como bilabiales), o por los labios y los dientes (/f/, también conocidas como labiodentales),  o por los labios y un cierre parcial en el velo del paladar (/w/, labiovelar). Dentales: entre los dientes y los alvéolos, como en la th inglesa (/T/ o /D/), o la t española.  Alveolares: en los alvéolos, el lugar justo atrás de los dientes (/s/, /l/, la t inglesa, la r y la rr españolas).  Palato-alveolares (o postalveolares): un poco más atrás, casi en el paladar duro (como sh en inglés, o j  en inglés y francés).  Retroflejas: como las palatoalveolares, pero la lengua se curva hacia atrás (de forma que lo que toca el paladar es la cara inferior). La característica r con sonido 'hueco' de buena parte de los dialectos norteamericanos del inglés es retrofleja.  Palatales: en la cúspide del paladar (el sonido de la i en diptongo, como en hierro, diodo, diálogo). Velares: en la parte de atrás de la boca, o velo (/k/, la j  española /x/, la ng inglesa /N/ como en sing). Uvulares (o postvelares): muy atrás en la boca, en la úvula (o campanilla) (el sonido oclusivo /q/, tal como aparece en árabe; la r francesa). Glotales: en la parte de atrás de la garganta, pronunciadas con participación del órgano (la epiglotis) que cierra la glotis o pasaje entre el esófago y la tráquea.  Por ejemplo, la h inglesa, el glottal stop que aparece ante vocales iniciales.

Algunas otras dimensiones son:
l

l l

l

l

Voz: presente cuando las cuerdas vocales vibran al producir el sonido (que se llama sonoro), ausente cuando no vibran (sordo). Los sonidos /p t f/ son sordos, mientras que /b d l/ son sonoros. Nasalización: depende de si pasa aire por la nariz o no. Los sonidos /m n/ son nasales. Aspiración: (sobre todo hablando de oclusivas) se presenta cuando hay una 'explosión' de aire al soltarlo. Los sonidos /p t k/ iniciales, en inglés, son  aspirados. (La aspiración es lo que hace que la t de la palabra inglesa two suene parecida a una ch a muchos hispanohablantes.) Palatalización: cuando la parte media de la lengua se eleva hacia el paladar al pronunciar la consonante. La ñ española (y la ll, en España) son palatales o  palatalizadas, según el análisis que se haga.  Glotalización: cuando hay un cierre en la glotis al mismo tiempo que se pronuncia el sonido principal, y ambas obstrucciones se sueltan juntas.

Examinemos ahora estos contrastes. Los llamo contrastes porque eso es lo que son: cosas que pueden ser distinguidas. La lingüística se basa en contrastes, en  diferencias. Si un lenguaje no distingue entre dos sonidos, entonces, para todos los propósitos prácticos, es el mismo sonido, y como tal debe ser estudiado. La voz (vibración o no de las cuerdas vocales) es un contraste muy común en los lenguajes occidentales indoeuropeos, aunque no en muchas otras familias lingüísticas,  donde esta distinción no se hace (de manera que, por ejemplo, /p/ y /b/, o /t/ y /d/, son el mismo fonema). La nasalización es un contraste muy común. Las nasales más comunes son a su vez oclusivas sonoras, pero algunos lenguajes (como el galés) tienen nasales sordas, y  unos pocos tienen nasales fricativas. Si no te imaginás como pronunciar una nasal sorda, tené en cuenta que una m es similar a una b nasalizada (la diferencia es mínima), de manera que una m sorda es casi como una p  nasalizada: pronunciá una p  al mismo tiempo que dejás salir aire por la nariz, y listo. Mucha gente de hecho 

nasaliza las consonantes (y las vocales) después de una nasal, aunque no se dan cuenta: la distinción generalmente no es fonémica (no se puede usar para distinguir una  palabra de otra). Ya hablamos de la aspiración. Un lenguaje puede tener oclusivas aspiradas, no aspiradas, o ambas; y puede hacer fonémica esa distinción (como el hindi) o sólo  fonética (como el inglés). La palatalización es un fenómeno bastante común entre los lenguajes. Una consonante se palataliza elevando la parte media de la lengua hacia la parte superior de la  boca (el paladar). Normalmente la consonante palatalizada tiene una contrapartida alveolar. El resultado es algo que suena como la consonante alveolar correspondiente más un sonido /j/ (como la i en 'tiene' o, en España, la y  de 'yo'). El ruso tiene una serie de consonantes palatalizadas, transliteradas con un apóstrofe  (t', l', d'). El español (peninsular) tiene dos, ll (en IPA, /L/) y ñ (/J/); el francés tiene también éste último, escrito gn, y el portugués tiene lh, nh. La glotalización se hace cerrando la glotis (el órgano que impide que la comida vaya a los pulmones y el aire al estómago, cuando se cierra a tiempo), y abriéndola al  mismo tiempo que se pronuncia el sonido. Los sonidos glotalizados son generalmente oclusivas, y se las llama también eyectivas. Se puede crear una glotalización  produciendo un glottal stop (oclusiva glótica) al mismo tiempo (en coarticulación) que la oclusiva principal, y luego liberando ambos cierres al mismo tiempo. Pero  ¿qué es un glottal stop? Al comenzar una palabra en vocal, y si no hay nada antes, solemos producir uno antes de la vocal, aunque no nos damos cuenta. También  cuando queremos separar dos vocales, haciendo una pausa entre ellas. Al aclararnos la garganta dos veces, generalmente hay un glottal stop entre ellas. En alemán,  siempre hay un glottal stop antes de una vocal inicial. Este sonido no es fonémico en alemán o en español, pero es bastante común en otros lenguajes, generalmente  transliterado como un apóstrofe (como en hawaiiano o klingon), o con su símbolo IPA, similar a un signo de interrogación sin punto (transliterado /?/). El georgiano y el quechua tienen sendas series completas de oclusivas sordas glotalizadas o eyectivas, que también se llaman glotálicas egresivas. También hay consonantes glotálicas ingresivas, o implosivas. Para producir una implosiva, hay que crear, además de una aproximación o clausura en otro punto,  una clausura o cierre en la glotis, luego bajar la glotis, y al alcanzarse una cierta presión soltar ambos cierres. Algunos lenguajes africanos, entre otros, tienen  consonantes implosivas, que son usualmente oclusivas sonoras. Mi lenguaje construido g'amah tiene oclusivas implosivas y nasales implosivas. Algunos otros contrastes que no mencioné hasta ahora: Una consonante lateral es una en la que la lengua mantiene cerrado el paso de aire en la parte central de la boca, pero dejando que fluya aire por los costados. La lateral más común que conocemos es /l/, que usualmente indica un sonido alveolar y sonoro. Sin embargo, el inglés tiene dos variantes, una alveolar y otra velar  [L\]; ésta última (llamada dark L o 'L oscura') es la que le da ese sonido extraño a la l en palabras como milk, sell, etc. Esta l velar es más parecida a una g que a otra cosa. Ambas variantes, al igual que nuestra l, son sonoras, pero algunos lenguajes, como el galés, tienen una l sorda y fricativa (que se escribe /K/, y se parece a una mezcla entre /l/ y /s/). Una consonante retrofleja se produce doblando la lengua hacia atrás dentro de la boca, hasta que toque el paladar con la punta de la cara inferior. La retroflexión  existe y es fonémica en muchos lenguajes. Las retroflejas también se llaman apico-palatales (lo cual significa que el ápice, o sea la punta de la lengua, toca el paladar).  No hay ejemplos conocidos (para nosotros) de retroflejas, excepto la r de muchos dialectos del inglés norteamericano. En sánscrito hay una serie completa de  consonantes retroflejas que van paralelas a las alveolares, y se transliteran como t, d, s, etc., con un punto debajo. Si sólo se usan las dos dimensiones principales (grado de cierre y punto de articulación) y se simplifican algunos puntos de articulación, puede mostrarse la distribución  de las consonantes del español rioplatense en una grilla como ésta:
labial oclusivas fricativas africadas aproximantes nasales p b f lab-dnt dental t d s 4 l r n S tS J alv alv-pal velar k g x

m

Nótese que /S/ representa el sonido tanto de ll como de la y  consonántica, ya que ambas consonantes se funden en una en este dialecto, y su articulación varía entre  la postalveolar a la francamente palatal. Esta tabla es válida, sin estas consideraciones, para todos los otros dialectos del castellano.

Nuevas consonantes
¿Cómo inventar nuevas consonantes para tu lenguaje? El primer paso debería ser decidir qué contrastes vas a usar. El español tiene tres puntos de articulación (PdAs)  para las oclusivas, que son normalmente el marco de referencia, y distingue voz para las oclusivas (no para las fricativas) y nasalización. Lo más importante es notar que la fonología de un lenguaje es un sistema. Las consonantes que estén fuera del sistema (porque, por ejemplo, usan contrastes  excepcionales) tienden a perderse y desaparecer, o se funden con otras similares. Por ejemplo, el español no podría tener una eyectiva (glotalizada) porque usaría un  contraste que no se encuentra en ningún otro punto del lenguaje, y no sobreviviría mucho tiempo. Las excepciones (como la presencia de /tS/, el sonido ch, que es la única africada) son posibles, pero no deberías abusar de ellas. Si tenés un sonido exótico, deberías tener otros del mismo tipo. Por otra parte, probablemente no  deberías inventar muchos sonidos extraños; tenés que saber cómo pronunciar cada uno de ellos, y ser capaz de leer tu lenguaje fluidamente. (Esto también involucra  una planificación cuidadosa del esquema de transliteración.) Una vez decididos los contrastes que vas a usar, armá la grilla y llená los huecos. Probablemente tengas que inventar nuevos símbolos o digrafos para algunas letras  (ver Cómo escribir). Si te parece que hay muchas consonantes, borrá una serie, o algunos miembros. No hay obligación de ocupar todos los lugares de la grilla (el  español, como habrás visto, deja muchos espacios vacíos). Por ejemplo, podés tener oclusivas sordas y sonoras, pero solamente fricativas sordas y nasales sonoras, y  no tener africadas. El español tiene sólo una africada, ch /tS/; en cambio, tu lenguaje podría tener africadas en todas las posiciones donde haya una oclusiva y una fricativa. Por ejemplo,  las consonantes pf  (que se encuentra en alemán, como en Pferd), ts (también en alemán, escrita z como en zehn, y en japonés, como en tsukuru, aunque sólo es una  variante alofónica de /t/), tth /tT/ (donde /T/ es la th sorda del inglés, o la z dental del español de Castilla), tsh (ch), kkh (como sonarían kj simultáneas en  español), etc. Puede completarse una serie de consonantes, por ejemplo las nasales españolas: no hay nasal velar (no hay razón para que la haya, pero tampoco para que no). Una  nasal velar es el sonido del grupo final escrito ng en inglés). También podría completarse la serie de las oclusivas para que hubiera una palatal que se correspondiera 

con la nasal ñ (/J/), etc. Para meterte de lleno en la cosa, podrías añadir un contraste no usado en español, y crear una serie de consonantes palatalizadas. O usar la aspiración como distinción  fonética, o lateralizar o retroflexionar consonantes. Como dice Mark Rosenfelder, la clave de un lenguaje naturalista es añadir (o sustraer) dimensiones. Estudiante de  quechua, menciona él que este lenguaje no tiene una o dos, sino tres series de oclusivas: aspiradas, no aspiradas, y glotalizadas; pero no distingue entre consonantes sordas y sonoras. De manera que para un hablante de quechua la p de peso y la b de beso son el mismo sonido (fonema), y las dos palabras suenan como lo mismo. Algunos sonidos son más comunes que otros. De acuerdo a las fuentes de Mark Rosenfelder, la mayoría de los lenguajes tienen las oclusivas simples /p t k/. Por lo que he podido averiguar, los sistemas fonológicos más simples corresponden al hawaiano, con ocho consonantes y cinco vocales, y el rotokas, con sólo seis  consonantes y cinco vocales. El quechua tiene muchas consonantes pero sólo tres vocales (/a i u/, que son las más comunes). El sistema más complejo parece ser  el del !xu~ (o !kung), lengua de la familia khoisan de África, con 92 consonantes (47 de las cuales son clicks).

Vocales
Las vocales se producen exactamente igual que las consonantes; no son diferentes esencialmente de ellas. Pero el detalle principal es que el flujo de aire prácticamente  no es molestado de ninguna forma al pasar por la boca; sólo es modulado por la posición de la lengua y otras partes de los órganos del habla. Además, las vocales son  normalmente sonoras (algunos lenguajes tienen vocales sordas, especialmente al final de las palabras; suenan como pronunciar una h inglesa con la lengua, labios, etc. en la misma posición que para la vocal). Las vocales varían a lo largo de las siguientes dimensiones:
l

l

l

l

l

l

l

l

l

l

Altura: cuán abierta está la cavidad de resonancia, formada dentro de la boca por la lengua (cuanto más alta está la lengua, más cerrada la cavidad). Las  vocales se clasifican usualmente en altas (/i/, /u/), medias (/e/, /o/), y bajas (/a/). Esta escala es por supuesto continua, no discreta; en algunos casos no puede describirse una vocal como media o baja, por ejemplo, pero se puede decir que es más alta que /a/ pero no tan alta como /e/. Frontalidad: cuán cerca está la parte articuladora de la lengua del frente de la boca. Puede variar desde frontal (/i/, /e/), a central (/a/), hasta posterior (/o/, /u/). Las vocales frontales se llaman a veces palatales, y las posteriores velares. Redondeamiento: depende de si los labios están redondeados o no. Las vocales /o/, /u/, la u francesa o la ü alemana (IPA /y/) son redondeadas, mientras que las vocales /i e a/ son no redondeadas. In muchos lenguajes esto cubre todas las posibilidades, pero de hecho el sueco tiene tres grados de redondeamiento en una vocal frontal, desde no redondeada hasta totalmente redondeada, pasando por semi-redondeada. Longitud: cuánto tiempo se estira la vocal, por supuesto. El español o el inglés no distinguen las vocales por longitud, pero el latín, el griego, el inglés antiguo y  muchos otros sí. El estonio tiene tres grados de longitud (vocales cortas, semilargas y largas).  Nasalización: como las consonantes, las vocales pueden ser nasalizadas. En español, una vocal al lado de una consonante nasal generalmente se nasaliza, pero  esto no es distintivo (fonémico). En francés, por otro lado, hay cuatro pares de vocales que se distinguen por ser nasales u orales.  Voz: las vocales normalmente son sonoras, pero algunos lenguajes tienen vocales sordas (suenan como /h/ con los labios y lengua en posición para pronunciar  la vocal). En japonés, /u/ e /i/ son sordas si no tienen tono alto y se encuentran entre consonantes sordas (pero se hacen sonoras cuando por alguna razón se  las enfatiza). Tensión: es difícil de explicar, excepto con ejemplos; en inglés tenemos que las vocales /I/ y /U/ de pit y put son laxas, mientras que /i/ y /u/ como en repeat y boot son tensas. En español, /e/ y /o/ tienen variantes alofónicas tensas cuando están en sílaba abierta (terminada en vocal) y laxas cuando están en  sílaba cerrada (terminada en consonante).  Retroflexión: igual que la retroflexión en consonantes. Una vocal se hace retrofleja curvando y doblando la lengua hacia atrás, de manera que la parte inferior  quede levemente hacia arriba. Un cierto lenguaje africano cuyo nombre no recuerdo ahora tiene tres series de tres vocales cada una; la primera es de no retroflejas, la segunda de semi-retroflejas, y la tercera de totalmente retroflejas. Constricción: una vocal constreñida suena como si te estuvieras atragantando. En algunos lenguajes, éstas y otras formas de pronunciar sonidos son fonémicas,  no sólo un accidente.  Otras: hay más contrastes para vocales, pero no sé nada de ellos. Otras modificaciones se pueden hacer por medio del acento y el tono (en lenguajes tonales, como el chino o el vietanamita; ver abajo).

El español tiene este sistema vocálico:
front centr post altas medias bajas i e a o u

Este diagrama en forma de triángulo es recurrente, y se encuentra en todos los libros de fonética; usa las dos dimensiones principales (altura y frontalidad). Puede  pensarse el triángulo como un diagrama del interior de la boca, donde los dientes (la parte frontal) están a la izquierda. Dentro del triángulo puede haber vocales en  cualquier lugar. Los sonidos centrales y medios, como la schwa inglesa (/@/), son los menos distinguibles y marcados; la schwa está justo en el centro del triángulo,  sobre la /a/. En ruso hay una vocal central alta /i\/ (en cirílico ы), que se encuentra también sobre la /a/, pero más arriba, en el medio de la línea i—u.

Nuevas vocales
Como ocurre con las consonantes, podés inventar tantas vocales como quieras. Tendrías que tener en cuenta que las vocales forman un sistema, uno que no debe estar  desbalanceado. Si hay una versión tensa y una laxa de i, es porque estás usando la tensión como contraste, y debería estar presente en algún otro par de vocales. El redondeamiento, aunque así lo parece, no está desbalanceado en español. Parece ser que el redondeamiento es más frecuente en las vocales posteriores que en las  anteriores. Sin embargo, muchos lenguajes tienen frontales redondeadas, que el español no tiene (el alemán y el francés tienen ambos formas redondeadas de i y e, escritas ü y ö en alemán). Por otro lado, podés usar vocales posteriores no redondeadas (como la u japonesa). Puede haber tantas vocales como quieras. Los sistemas más simples tienen tres, generalmente /i a u/ (los vértices del triángulo, y no por casualidad). Esto significa  que distinguen tres sonidos vocálicos, no que sus hablantes no puedan o sepan pronunciar una [e] o una [o]. Un hablante de quechua puede decir algo que suena como [e] a un hablante español, pero que es de hecho una /i/, de la cual el sonido [e] es una mera variante alofónica. El español y el japonés tienen cinco vocales, /i e a o u/. El inglés británico estándar tiene doce vocales, el alemán catorce, y el sueco alrededor de diecicho. Pero 

no hace falta que llegues a tanto. Hay al menos dos lenguajes naturales con sólo dos vocales, el abkhazio y el abaza, hablado en el Cáucaso Noroccidental, a los cuales podría sumarse otro del mismo  origen, el ubykh, si no fuera porque se supone extinto. Estas vocales probablemente podrían caracterizarse como /a/ e /i/, donde /i/ tendría como variantes [i], [u] y quizá cualquier otro sonido alto, sea frontal, central o posterior, redondeado o no.

Acento y altura
El acento es por supuesto la fuerza que ponemos en cierta sílaba de cada palabra (o de las palabras importantes en una oración completa). Un lenguaje puede tener  una regla de acentuación regular, en cuyo caso solamente hay que mencionarla, o puede tener una acentuación irregular, en cuyo caso deberías indicarla. En español,  por ejemplo, aunque el acento es impredecible, hay reglas para saber dónde colocarlo en palabras que uno lee, ya que se lo indica usando un 'acento agudo' o tilde, o  se explicita por la forma de la palabra. En inglés, el acento es también impredecible, pero no se lo marca de ninguna forma en la escritura. En francés, todas las  palabras se acentúan en la última sílaba (el uso de 'acentos' agudos, graves y circunflejos no tiene nada que ver con esto). En quechua, todas las palabras son graves;  en finés, el acento cae en la primera sílaba, no importa lo larga que sea la palabra. En latín, la regla es un poco más compleja: se acentúa la penúltima sílaba si es larga  (es decir, si contiene una vocal larga o termina en una consonante), y si no se acentúa la antepenúltima. Es decir que seculus es /'sekulus/, mientras que secundus es /se'kundus/ (el apóstrofe, en IPA, indica que en la próxima sílaba cae el acento). La altura se refiere al nivel (musical) de una sílaba, que puede ser alto, medio, bajo, etc. El japonés usa un sistema de acentuación por altura, que ignora la fuerza o  acento al que estamos acostumbrados, y marca las palabras con distintos patrones de altura. Algunas sílabas son bajas, y otras altas, dependiendo de dónde caiga un  punto en particular donde la altura baja más abruptamente (ver aquí para más detalles). En japonés no hay palabras graves, agudas, esdrújulas, o de cualquier otro tipo  como ése; lo que varía es la altura, no la fuerza de las sílabas. En la mayoría de los lenguajes, algunas palabras no reciben acento (de fuerza o de altura) cuando participan de una oración completa. En español, por ejemplo, en la  frase 'La casa es vieja', no hay acento sobre 'la' ni sobre 'es'. Al perder su acentuación, además, estas palabras en algunos lenguajes reducen sus vocales,  transformándolas en versiones más centrales y menos distintivas (por ejemplo, el inglés tiende a reducir las vocales no acentuadas a /@/ o /I/).

Tono
El tono es el perfil de entonación de una sílaba. Existe en todos los lenguajes, pero no suele ser fonémico. En español, podés pronunciar '¿Qué hiciste?' con muchos  tonos distintos, pero las palabras son las mismas. En algunos lenguajes, el tono es fonémico. Estos lenguajes incluyen el chino mandarín, el cantonés, el vietnamita, y muchos lenguajes africanos. Cada sílaba recibe un  tono particular, que es tan característico como la altura de las vocales que contiene, y que puede distinguir palabras. El mandarín, por ejemplo, tiene cuatro tonos,  llamados alto, ascendente, descendente bajo y descendente alto. Ejemplos de Mark Rosenfelder: ma 'madre', má 'cáñamo', mâ 'caballo', mà 'maldición'. El vietnamita  tiene seis tonos, dos de los cuales incluyen una pronunciación tan grave que las vocales presentan creaky voice o voz quebrada, donde las vibraciones de las cuerdas vocales son de tan baja frecuencia que se pueden oír separadamente. Podés tratar de usar tonos en tu lenguaje, pero no lo recomiendo a menos que sepas hablar un lenguaje tonal previamente. Es una característica interesante, pero  requiere mucha reeducación de los órganos del habla. El tono puede ser una característica fonémica y/o (raramente) un dispositivo gramatical. Hay una interesante discusión corta en un trabajo de Marjorie K.M. Chan [en inglés]: "Tone and Melody in Cantonese", que plantea y responde tentativamente una pregunta interesante: ¿cómo se hace para cantar una canción en un lenguaje tonal?

Restricciones fonológicas
Cada lenguaje tiene combinaciones de sonidos que son consideradas difíciles, prohibidas, o imposibles. Se llaman restricciones fonológicas, y son los moldes en los que toda palabra tiene que caber o hacerse entrar para lograr coherencia y 'familiaridad'. Lenguajes como el inglés están bastante libres de restricciones fonológicas. De ahí la gran cantidad de palabras extranjeras que ha podido absorber, como garage, sombrero, mosquito, ersatz, schmuck... Algunos lenguajes no resisten tales invasiones. El español, aunque no tan libre, permite una cierta relajación, pero otros no. Por ejemplo, el japonés (uno de los lenguajes más restringidos) sólo permite sílabas formadas por una consonante (quizás doble, o ninguna), una vocal, y  opcionalmente /n/: (C)V(n). La palabra inglesa club fue adaptada al japonés como kurabu, para dar sólo un ejemplo. Aún un nombre español sencillo como  Rodríguez se transforma en Rodorigesu. Cualquier fan del anime conoce además las indelicadezas cometidas por los creadores de superhéroes (y heroínas) al forzar  gritos de batalla en inglés a la fonética del japonés, como cuando Sailor Moon exclama muun kurisutaru pawaa meeku appu!, o sea "moon crystal power make up!". El lenguaje hablado en las islas Fidji es casi igual de restringido: consonante más vocal, con una consonante opcional al final de las palabras. El finés no toleraba combinaciones de consonantes como /pr/ o /fl/ hasta no hace mucho. El lenguaje élfico Quenya directamente no tolera combinaciones de  consonantes iniciales o finales. Las palabras griegas sólo pueden terminar en /s/, /n/ o una vocal. Algunos lenguajes pueden usar ciertos sonidos junto con otros, nunca solos. Es difícil diseñar un patrón in abstracto; pero deberías hacerte una idea de él. Lo principal es definir si tu lenguaje será vocálico o consonántico, por decirlo en  términos no técnicos e inexactos. El inglés y la mayoría de los lenguajes del norte de Europa son bastante consonánticos. El español, el japonés y el griego son bastante  vocálicos. El hawaiano es muy vocálico (¡una palabra como Kilauea no es posible en muchos lenguajes!). La tendencia global, de acuerdo a algunas teorías, es hacia  la estructura básica consonante + vocal. Podrías empezar por ahí. Un lenguaje sintético con muchas inflexiones generalmente prefiere una estructura simple. (Sin embargo, considérese el georgiano, un lenguaje muy aglutinante, donde  se pueden encontrar hasta seis consonantes seguidas, como en vprtskvni 'Yo lo estoy pelando' [ts es una africada y cuenta como una sola consonante]). Un lenguaje aislante puede tener palabras muy intrincadas, ya que no se les va a añadir nada más a ellas. Lo mejor es probar y probar hasta que las palabras comiencen a sonar  bien respecto a tu gusto y ánimo particular (¡pero no lo cambies a mitad de camino!). Los sonidos tienden a influenciarse unos a otros y a cambiar. El cambio de sonidos puede eventualmente producir un nuevo lenguaje o dialecto.

Cambio de sonidos
Nadie sabe por qué, pero los sonidos cambian en todos los lenguajes. Los únicos lenguajes que no cambian son los muertos. Los sonidos se transforman en otros, y a veces por influencia de otros. Los cambios de sonidos se pueden clasificar en condicionados e incondicionados (no recuerdo si hay palabras más correctas para esto). Un cambio de sonido incondicionado transformó la palabra inglesa antigua sceadu /'sk&adu/ en shadow /'S&dOw/, de la misma forma que en toda otra palabra que comenzaba con /sk/ éste la cambió a /S/ (sh). La mayoría de las palabras inglesas modernas con /sk/ inicial son préstamos escandinavos, por si te lo estabas preguntando. Un cambio de sonido condicionado transformó el francés marbre en el inglés marble (la segunda /r/ se disimiló de la primera). Los tipos principales de cambio de sonido influenciado son:
l

l

l

l

l

l

l

l

Asimilación: un sonido se acerca a otro vecino. Por ejemplo, la misma palabra asimilar, del latín ad- + simul-; la /d/ se volvió /s/ a causa de la /s/ vecina (luego las dos se fundieron, desde luego). La asimilación puede transformar a los dos sonidos a la vez (recíproca), al primero (regresiva) o al segundo  (progresiva). Disimilación: lo contrario a la asimilación; dos sonidos idénticos o similar se apartan uno de otro. Por ejemplo, el cambio marbre → marble ya mencionado, o el cambio del mismo tipo ocurrido con palabras latinas como arbor, que dio en español árbol. La disimilación suele ser para evitar cacofonías.  Metátesis: dos sonidos intercambian sus lugares. Esto generalmente produce una nueva combinación más fácil de pronunciar (aunque 'fácil' es un término muy  subjetivo). Por ejemplo, en español antiguo en palabras como dejadle solía producirse metátesis en dejalde. Elisión, síncopa, apócope: todos éstos son nombres para el mismo fenómeno. Se refieren a la pérdida de sonidos; elisión específicamente significa pérdida de  vocales o sílabas no acentuadas, mientras que síncopa se refiera a la pérdida de sonidos medios, y apócope es la pérdida de sonidos finales. En francés se  produce mucha elisión, como en au revoir /or'vwa/. La pérdida de la /e/ final en inglés y francés es un apócope, al igual que las formas alternativas de  algunos adjetivos en español, como gran vs. grande. Haplología: la pérdida de una secuencia de sonidos por semejanza con sonidos vecinos. En latín, según las reglas de derivación y cambio esperadas,  stipendium debería haber sido *stipipendium; la misma haplología se reduciría probablemente a haplogía si fuese un término más comúnmente usado.  Liaison ('ligadura', pronunciada /li.e'zo~/): la introducción de un sonido entre otros dos, especialmente entre palabras. El francés, de donde viene la  palabra, produce mucha: las consonantes finales 'perdidas' de muchas palabras reaparecen cuando la siguiente palabra empieza por vocal. Por ejemplo, C'est moi /,sE'mwa/ vs. C'est Anne /,sEt'an/. Prótesis: se añade un sonido inicial extra al principio de ciertas palabras, como la /e/ que en español se añadió a las palabras latinas comenzadas en /sp/ (y hoy en día aún a muchos préstamos ingleses): latín spectrum → espectro. Epéntesis: un sonido medio extra se añade entre otros. En galés, una vocal epentética aparece entre ciertos pares de consonantes en position final; por ejemplo llyfr se pronuncia como si fuese llyfyr.

Los cambios de sonido condicionados e incondicionados no son siempre fáciles de separar. Si tomamos la definición como una regla estricta, casi todos los cambios  son condicionados; muy pocos son absolutamente espontáneos. Por ejemplo, el cambio de la /k/ latina (escrita c) en los lenguajes romances se ve como incondicionado, pero fue de hecho producido por la influencia de las vocales: /k/ cambió en /s/ en español y francés (aunque siguió siendo escrita c) cuando el sonido siguiente era una vocal frontal (/e/ o /i/). El cambio de sonidos suele producir irregularidades. En español, las diferentes formas en las que cambió la /k/ latina produjo las formas irregulares del verbo decir: digo, dice, dijo, dicho. Pero un cambio de un tipo específico puede ser regularizador. Se llama analogía, y se lo tratará en su propia sección.

Reglas de cambio de sonidos
Los cambios de sonido pueden ser de muchos tipos distintos, como se vio arriba; pero todos cumplen ciertas reglas:
l

l

l

El cambio de sonidos es gramaticalmente irrestricto. Si un cierto fonema cambia a otro, no importa qué clase de palabra sea. Una regla de cambio que  transforma un fonema o conjunto de fonemas en otro puede incluir sólo restricciones fonéticas, por ejemplo: 'A cambia a B cuando sigue a C, excepto en sílabas  acentuadas', o 'X intervocálica cambia a YZ'. Una regla de cambio no puede restringirse a ciertas clases de palabras o construcciones gramaticales, como 'A y  B finales se pierden, excepto en los adjetivos' o 'X cambia a Y en los sustantivos con inflexión'.  El cambio de sonidos no tiene memoria. Esto puede sonar estúpido, pero no lo es. Una regla de cambio que transforma X en Y no puede discriminar entre  una cierta X que el lenguaje ha tenido desde el principio y otra X que proviene de un cambio anterior W → X. Los ciclos de cambio de sonidos son  acumulativos y cada uno, por decirlo así, borra las huellas del anterior.  El cambio de sonidos es imparable. Algunas personas solían pensar que un lenguaje escrito ayuda a evitar el cambio en el lenguaje hablado. Esto es  obviamente falso. Lo que hace un lenguaje escrito es hacer que las palabras escritas se vean como eran antes de cambiar. Si aprendiéramos nuestro lenguaje  nativo de los libros, el argumento sería probablemente válido; ¡pero aprendemos a hablar escuchando a otra gente hablar! Si un lenguaje no cambia, es  probablemente una lengua muerta. Esto por supuesto no se aplica a los lenguajes artificiales auxiliares como el esperanto, o a lenguajes artificialmente resucitados y mantenidos vivos como el latín. Con respecto al esperanto, no sé si los esperantistas hablan el lenguaje en su casa para que sus hijos lo oigan y  aprendan como (segunda) lengua nativa. Si lo hacen, los niños probablemente harán algunos cambios muy lentamente a medida que pasan los años (si ellos  hacen lo mismo con sus hijos, y así sucesivamente). Esto quizá horrorizaría al doctor Zamenhof y a sus seguidores, pero sería un signo seguro de que el lenguaje  es de hecho usado para la comunicación y está vivo, un lenguaje natural(izado) más entre pares. En cuanto al latín, todos lo hablan más o menos como  prefieren...

Estas reglas pueden tener excepciones, pero deben ser adecuadamente explicadas. Si escribís la historia de tu lenguaje, podés explicarlas o bien decir que "por alguna  razón desconocida...", pero no dejes que esto se vuelva una excusa para violar las reglas lingüísticas. Las excepciones a estas reglas son causadas en general por la analogía o procesos relacionados que tienden a regularizar el lenguaje. Por ejemplo, si un cambio hace que X se vuelva Y y esto provoca que dos pronombres suenen igual, una de éstas cosas ocurrirá: 1) nada, 2) los dos pronombres se fundirán en uno, gramaticalmente  como lo fueron fonéticamente, 3) el pronombre que cambiaría se 'rehusará' a cambiar, 4) la gente dejará de usar uno de los pronombres para evitar la confusión,  reemplazándolo por otra construcción. El cambio de sonido puede ser lentificado o acelerado. Algunas personas han tratado de formular un conjunto de factores que podrían causar que un lenguaje entre en  una fase de cambio rápido (como caos económico y social, guerras, un movimiento religioso nuevo, etc.) Estas teorías se han demostrado inútiles. Seguramente hay  factores sociales que regulan la velocidad y calidad del cambio de sonidos, pero dependen de tantas 'variables sociales' que son imposibles de calcular. Algunas las podés imaginar: si un país cerrado (en una isla, por ejemplo) de pronto entra en contacto con una cantidad masiva y constante de visitantes extranjeros, su lenguaje 

probablemente comenzará a cambiar más rápido, tomando prestadas nuevas palabras y estructuras, creando o copiando expresiones idiomáticas, e inventando  palabras para conceptos que antes no conocían. Otra causa de excepciones es el hecho de que algunas palabras son menos comunes que otras. Las palabras cambian si son dichas y repetidas una y otra vez, siendo así 'desgastadas'; las palabras extrañas y raramente usadas probablemente quedarán incambiadas. Estas palabras raramente usadas incluyen términos muy educados,  muy formales o específicos. Algunas veces no son exactamente preservados, sino represtadas desde el lenguaje antiguo (u otro), como tiroides, que viene del griego thurā 'puerta' y ésta a su vez del protoindoeuropeo *dhwor-, de donde también provienen fuera, foro, forense, foresta  y el inglés door 'puerta'; o semáforo, donde foro 'llevar' tiene mismo origen, *bher-, que el elementio f(e)r - que aparece en conferir, diferir, inferir, preferir, proferir, transferir, vociferar, ofrecer, y hasta ferry . Algunos otros ejemplos incluyen pares de palabras relacionadas como noche-nocturno, recibir-receptáculo, ped ir-repet ir, hablarfabul ar, etc.

Armonía
Armonía es un cambio en alguna de las cualidades de un sonido, en ciertos contextos, para concordar o armonizar con otro sonido. Puede relacionarse (aunque no siempre) con un proceso de asimilación. Se produce entre los fonemas de la raíz de una palabra y los fonemas de los afijos (cambiando estos últimos para acomodarse  a las cualidades de los primeros). Por ejemplo, la armonía vocálica se encuentra en el finés y otros lenguajes fino-úgricos (como el húngaro), y en el turco, que son aglutinantes y sufijantes. En finés el  elemento radical viene primero y le sigue una cadena de sufijos. La vocal de la raíz está acentuada y marca el grupo armónico al que deben pertenecer todas las  vocales de los sufijos. Estos grupos armónicos se componen de vocales que comparten alguna característica (generalmente el punto de articulación, por ejemplo  frontal, central y posterior). Cada sufijo tiene varias formas alternativas, con vocales que pertenecen a cada uno de los grupos. Aquí hay algunas palabras finesas con  marcas de caso:
autossa 'en el auto' laatikossa 'en la caja' järvessä   'en el lago'

¿Ves cómo la vocal final alterna entre -a (posterior) y -ä (frontal)? Algunos otros ejemplos, con el tiempo perfecto de verbos:
on lyönyt   'ha golpeado' on ajanut 'ha conducido'

La marca de tiempo perfecto es -nut para las raíces con vocales posteriores, -nyt para raíces con vocales frontales (como y, que es /y/, como la ü alemana). La armonía vocálica puede extenderse a otros contrastes además del punto de articulación; puede incluir longitud, nasalidad o redondeamiento. La armonía de altura  vocálica es posible, pero no se la encuentra en ningún lenguaje natural conocido. Otra forma de armonía es conocida como armonía nasal. Se la encuentra en el guaraní (el lenguaje de un grupo nativo sudamericano que habitaba en el noreste de  Argentina y en Paraguay, donde el lenguaje aún es floreciente y de hecho es lengua única de un gran porcentaje de la población). La armonía nasal 'enciende' el  contraste de nasalización en ciertas consonantes de los afijos aglutinados (sí, el guaraní también es aglutinante) cuando la raíz de la palabra contiene consonantes  nasales. Así, muchos afijos tienen dos formas, una nasal y otra no nasal. Por ejemplo, de hecha 'ver' podemos formar jajoechapeve 'hasta que nos veamos'. Esto es no nasal. Pero de hendu 'oír' tenemos que decir ñañoendumeve 'hasta que nos oigamos'. La j , que es una palatal no nasal, cambia a una nasal palatal, ñ, y además la  oclusiva labial p (en -peve ) cambia a la nasal labial m (-meve). Puede haber otros tipos de armonía en tu lenguaje. Por ejemplo, una especie de 'armonía inversa' donde dos sílabas consecutivas no puedan tener la misma vocal, o no  puedan comenzar ambas por una cierta combinación de consonantes. Esto tiene mucha relación con el fenómeno de disimilación disimilación, sólo que es sistemático,  no accidental. El griego provee un ejemplo de esto: al derivar palabras de sus raíces, no puede haber dos sonidos fricativos que comiencen sílabas consecutivas; si los  hay, el primero se transforma en oclusiva. Por ejemplo, la raíz thrikh- 'pelo' da trikhós (en vez de lo que esperaba, **thrikhós). (El griego también produce mucha  asimilación.)

Umlaut y Ablaut
Umlaut es el nombre dado a la asimilación regresiva de vocales no contiguas. Asimilación, porque la cualidad de una de las vocales se asimila a la de la otra (en una o  varias de sus características fonéticas); regresiva, porque ocurre de atrás hacia adelante (la vocal afectada anticipa la cualidad de la vocal que provoca el Umlaut); no contiguas, porque se produce entre distintas sílabas, con las vocales generalmente separadas. En alemán se encuentra Umlaut en varios puntos de la gramática, como una manera de marcar plurales de sustantivos y también en varios tiempos verbales. Algo  similar ocurre en inglés, aunque aquí es diacrónico (el cambio se ve actualmente como una alternancia vocálica, siendo que el Umlaut ocurrió en una etapa anterior,  ahora oscurecida por la desaparición de la vocal que lo provocó). Se comprenderá mejor esto con ejemplos. El lenguaje que originó el inglés tenía un sufijo de pluralidad -i. Este sufijo provocó Umlaut de las vocales precedentes de la  raíz del sustantivo pluralizado (la forma singular quedó igual, naturalmente); las vocales afectadas fueron las centrales y posteriores, que se volvieron anteriores  (frontales). Luego el inglés perdió gran parte de las vocales finales y la fuente del Umlaut original quedó oculta:
           antes                           después >-------------------------------------> SINGULAR fo:t fo:t fo:t fo:t fu:t fUt 'pie' PLURAL      fo:ti  fø:ti  fe:ti  fe:t   fi:t  fit     'pies'

Un cambio similar dio origen a los pares singular/plural goose/geese, man/men, mouse/mice. El Umlaut es en general provocado por una de las tres vocales que forman los vértices del triángulo vocálico, /i/ - /a/ - /u/, en ese orden de frecuencia. En inglés y  alemán hay sólo Umlaut provocado por /i/, que frontaliza las vocales afectadas, pero el galés tiene, por ejemplo, Umlaut diacrónico por /a/, que baja la altura de las vocales: el femenino de gwyn 'blanco' es gwen, provocado por una -a final que se ha perdido. Ablaut

El Ablaut se menciona aquí como advertencia, ya que no es un cambio provocado sino básicamente arbitrario, en el cual las vocales de una raíz alternan según un  criterio gramatical, no fonético. Es Ablaut, por ejemplo, la alternancia que se observa en los verbos ingleses llamados 'fuertes', como por ejemplo los siguientes:
I sing. /sIN/ ("Canto.") I sang.        /s&N/   ("Canté.") I've sung. /sVN/ ("He cantado.") I write. /raIt/ ("Escribo.") I wrote.       /roUt/  ("Escribí.") I've written. /ritn/ ("He escrito.")

Si bien se supone que el Ablaut tiene alguna explicación diacrónica, ésta no se conoce con certeza. Según entiendo, el protoindoeuropeo ha sido reconstruido como un  lenguaje con Ablaut que quizá fue condicionado por la presencia de ciertas consonantes en cercanía de las vocales (es decir, por asimilación); esto debe ser así puesto  que Ablaut es muy frecuente en toda la familia indoeuropea.

Sandhi o mutación
Sandhi es el nombre dado por los antiguos académicos sánscritos a una serie regular de cambios de sonidos que se producen en las palabras en determinadas  condiciones. También se lo llama mutación. Estos cambios pueden ser de distintas formas. Mencionaré una, aquélla con la que estoy más familiarizado: la lenición. Lenición or suavizamiento es un cambio producido en los sonidos iniciales de las palabras cuando son usadas en ciertas posiciones, o para ciertos propósitos. Estos  cambios afectan los inicios de las palabras quitando, añadiendo o cambiando sonidos iniciales. Así, las palabras pueden tener dos o más formas. De los lenguajes occidentales que conozco algo, el galés y el irlandés tienen patrones de lenición. El galés, de hecho, inspiró la fonología del famoso lenguaje sindarin  inventado por J. R. R. Tolkien para los Elfos Grises de la Tierra Media. No conozco mucho del galés, pero tengo algo de material sobre el sindarin, que tiene patrones de lenición tomados del galés. Así que usaré el sindarin para los ejemplos. La lenición sindarin afecta las consonantes iniciales de las palabras en ciertos contextos. Una consonante lenitada cambia de esta forma: las oclusivas sordas p, t, k se hacen sonoras b, d, g. Las oclusivas sonoras se hacen fricativas, excepto g: b, d, g cambian a v, dh, y nada. Las sordas lh y rh se sonorizan en l, r; s da h, y m da v. En sindarin, una palabra es lenitada cuando es (a) el objeto de un verbo, y está junto a él, (b) cualquier cosa después de conjunciones y artículos, (c) un adjetivo que sigue el sustantivo al que describe, y (d) el segundo elemento de un compuesto. Por ejemplo: de certh 'runa' tenemos i gerth 'la runa'; de peth 'palabra' el hechizo mágico Lasto beth lammen 'Escucha la palabra de mi boca'; de calen 'verde' el nombre Tol Galen 'Isla Verde'; de mellyn 'amigos' el nombre Elvellyn 'Amigos de los Elfos'. Los patrones de mutación del galés son bastante más complicados que eso; hay tres tipos de mutación, llamados suave (lenición), nasal, y espirante. El galés también  muestra un fenómeno relacionado, que involucra la conjugación verbal (al menos para el verbo bod 'ser') donde las formas interrogativas y negativas, a parte de cambiar la entonación y/o usar partículas, producen un cambio de los sonidos iniciales. Se pueden usar otros tipos de lenición y mutación, y especificar cuándo se deberían aplicar. En el lenguaje africano ful, un sustantivo de la clase de las personas es  lenitado cuando se pluraliza; el singularjim  'compañero' se hace yim'be  en plural, con lenición j → y . Curiosamente, los sustantivos de la clase de las cosas mutan exactamente al revés.

Escribiendo tu lenguaje
Una vez determinados los sonidos que va a usar tu lenguaje, vas a necesitar una forma de escribirlos (transliterarlos) en el alfabeto latino, y quizá un alfabeto propio.  En un momento hablaremos de alfabetos. La transliteración puede ser una pesadilla. Lo ideal sería tener un símbolo para cada sonido, pero el alfabeto latino no tiene símbolos para representar algunos  sonidos muy comunes. Aquí está la primera elección que tenés que hacer: ¿vas a inventar o usar un símbolo para cada sonido, o vas a usar alguna otra manera? Si querés un símbolo para cada sonido, probablemente vayas a tener que usar símbolos que no son letras (como ' @ ? !) o recurrir a marcas diacríticas, es decir modificar letras usando pequeños signos encima (o debajo) de ellas. Los acentos y diéresis sobre las vocales son marcas diacríticas: á è î ÿ. El español muestra alguna  de sus vocales acentuadas con un acento agudo: acá éramos ínfimos órganos súbitos, y escribe el sonido nasal palatal como ñ. El inglés, por otra parte, no usa  diacríticos (pero su ortografía es impredecible y atroz). El francés usa acentos para mostrar que una e debe pronunciarse, y por tradición, en muchas palabras: été âme  à mère; y tiene una letra ç (cedilla) para representar /s/ antes de a, o, u. El portugués muestra las vocales nasales con una tilde(~) sobre ellas (como en são). De hecho, esta tilde es del mismo origen que la que va sobre ñ; se trata de una N estirada y estilizada por el uso. El alemán escribe las versiones frontales de las vocales  con una diéresis (ä ö ü). El danés escribe una especie de a redondeada con å, y una o frontal con ø. Muchos lenguajes tienen letras no estándar para ciertos sonidos, y  a menos que hablés uno de ellos y tu teclado esté configurado para ellos, no vas a poder acceder a ellas fácilmente al escribir tu lenguaje en tu computadora. Si no querés tantos símbolos extraños, probablemente vas a tener que usar dos o más símbolos (formando símbolos compuestos) para representar algunos sonidos, tal  como el español usa rr y ch para sonidos individuales. Éstos se llaman digrafos (los trigrafos, aunque posibles, deberían evitarse por su longitud). La letra h es generalmente útil para hacer digrafos. Pero hay que tener en cuenta algo: dos símbolos nunca deberían usarse para hacer un digrafo si pueden aparecer solos para  representar dos sonidos distintos. El español puede usar ch porque h no tiene sonido asignado y ch no se usa nunca para el mismo sonido que c (de los dos que tiene); podemos escribir ll porque no hay combinaciones /ll/ en nuestra fonología. En cambio, no podríamos usar ls para representar una fricativa lateral, porque ls representa dos sonidos, /l/ + /s/. La transliteración no tiene reglas sobre cuáles símbolos hay que usar para representar tal sonido, pero tendrías que tratar de hacer legible el lenguaje: está bien usar zh para representar /f/, pero la mayoría de la gente seguramente leerá algo completamente distinto de /f/ cuando se encuentren con este digrafo, y además, ya tenemos  un símbolo más familiar, f , para llenar este espacio, ¿verdad? La transliteración debería ser tan fonémica como sea posible. El español y el italiano son bastante fonémicos, y en cuanto al español en particular, es muy importante el  hecho de que se puede leer una palabra y saber siempre cómo se va a pronunciar. Por el contrario, el inglés tiene una ortografía arcaica, donde las palabras se  escriben como sonaban hace siglos, aunque en cierta medida se puede adivinar el sonido de muchas. Lo mismo o peor se puede decir del francés (Ferdinand de  Saussure cita como ejemplo la palabra oiseau, que se pronuncia /wa'zo/, de manera que no hay un solo sonido que se corresponda con una letra 'apropiada'). El

tibetano escrito es aún peor; el lenguaje escrito ha permanecido casi incambiado desde el siglo VII d. C. En cambio, otros lenguajes (como el ruso) son muy  consistentes en cuanto a la concordancia entre lo escrito y lo fonético. Desde luego puede haber utilidad en utilizar una ortografía arcaica. El inglés tiene muchos dialectos, y si se intentara representarlo fonéticamente sin ambigüedad, se  lograría una representación adecuada para algunos pocos dialectos pero incorrecta para otros; así, la forma escrita permite una intercomunicación entre los dialectos  (cada uno de los cuales pronuncia distinta una misma palabra escrita). Lo mismo vale para el tibetano, que además es una lengua sagrada (en la que están transcriptas  antiquísimas escrituras), por lo cual es interesante y útil conocer la etimología y forma precisa de las palabras antiguas, preservada en la ortografía. Cualquiera de estos  motivos, y otros, pueden utilizarse para "justificar" ficcionalmente una ortografía a primera vista complicada y contraintuitiva para un lenguaje construido, si su creador  tiene ganas de hacerlo.

Alfabetos y otras escrituras
Un alfabeto es una colección de símbolos que representan sonidos. Si querés poder inventar uno para tu lenguaje. Si lo hacés, y tu ortografía romanizada es fonémica,  tu alfabeto debería serlo también: un símbolo para cada sonido. También podés usar digrafos y añadir diacríticos. Si tu lenguaje deriva de otro lenguaje para el cual ya  tenías un alfabeto, probablemente el lenguaje más joven use el alfabeto viejo, pero algunas letras habrán cambiado de sonido. Por ejemplo, el español usa el alfabeto  latino, pero la letra c (que en latín era siempre /k/) ahora representa /s/ frente a e, i. Esto no es fonémico, pero es completamente regular. Al inventar letras, jugá un poco con ellas y escribílas rápidamente una después de otra. La gente en la mayoría de los casos escribe sin cuidado, y las letras muy  elaboradas probablemente serán simplificadas. También tenés que tratar de hacer que cada letra se distinga bien de las otras, para que no se las confunda. El punto  sobre la i apareció cuando el palito de la i minúscula comenzó a confundirse con las líneas verticales de las m y n en la escritura gótica. Algunas fuentes de  computadoras y los programadores distinguen 0 (cero) y O (la letra o mayúscula) escribiendo una barra sobre el cero. Tenés que decidir también cómo vas a escribir y leer. ¿Será de izquierda a derecha, como en el alfabeto latino y el cirílico? El hebreo y el árabe se escriben de derecha  a izquierda, y las vocales no se escriben excepto en los libros para niños y (el árabe) en el Corán. El japonés se escribe tradicionalmente (en novelas y manga) de arriba a abajo y de derecha a izquierda, pero en ciertos libros (de texto, como los de matemáticas) se escribe a la manera occidental, en líneas de izquierda a derecha.  Los japoneses leen intercambiablemente en un sentido u otro. Ideogramas, silabarios, etc. Los alfabetos no son la única manera de escribir. El chino usa ideogramas, o caracteres que solían representar un dibujo de un objeto. Cada carácter se lee como una  sílaba; pero palabras que suenan igual y no tienen relación se escriben como caracteres distintos. Los caracteres chinos (hanzi) tienen cada uno dos partes, el radical y la fonética. El radical da una idea del significado, y la fonética daban una idea del sonido (caracteres con la misma fonética representaban sílabas que rimaban, hace  milenios). Un radical puede actuar a veces como fonética y viceversa. Muchas veces la relación entre el significado original y el actual es sumamente tortuosa, o su  sentido se ha perdido en el tiempo. El japonés usa un sistema mixto de kanji (ideogramas, tomados de los chinos) y kana (caracteres silábicos fonéticos). En general, el contenido principal de lo que uno  dice (las raíces de las palabras) se escribe en kanji, mientras que las partículas, conjugaciones y terminaciones se escriben en kana. Hay unos 90 kana divididos en dos conjuntos equivalentes (hiragana y katakana). Se usan normalmente hiragana para las palabras japonesas originales; se prefieren katakana para las palabras prestadas o inventadas, y también para añadir énfasis, como la cursiva en el alfabeto latino. Cuando se usa un kanji inusual, se puede clarificar escribiéndolo  fonéticamente en hiragana (que se llaman en este caso furigana). En un kana se puede cambiar la calidad de la consonante usando algunas marcas diacríticas. Hay  1945 kanji estándar, de los cuales 1006 se enseñan en la escuela primaria, y cada kanji se puede leer de acuerdo a su pronunciación japonesa (kun-yomi ) o a su pronunciación china original (on-yomi ). Como si no fuese complicado ya, cada kanji suele tener varias lecturas para cada forma. El coreano usa un alfabeto llamado hangul que es un código característico (featural code ), un sistema en el cual sonidos similares se representan con símbolos  parecidos. La tradición dice que fue inventado por un rey. En cualquier caso, requiere un notable análisis fonético. En hangul, los símbolos se agrupan en sílabas,  haciendo que la escritura parezca como si consistiese de muchos ideogramas o caracteres silábicos, el cual no es el caso. El árabe usa una escritura cursiva, lo cual es raro porque la mayoría de los pueblos históricamente han comenzado con letras de bloque aisladas, debido a la  naturaleza del soporte material de su escritura (piedra, arcilla o madera). El árabe, imagino, comenzó desde el principio a ser escrito con pinceles finos sobre alguna  superficie lisa; las letras cursivas son completamente inadecuadas para esculpirlas rápidamente en piedra o arcilla. En árabe y en hebreo no se escriben las vocales  (excepto las vocales largas en árabe), sino sólo las consonantes, debiéndose interpolar las vocales según el contexto; este tipo de sistema se llama abjad. El tailandés, aunque de raíces monosilábicas, usa un alfabeto fonético de letras únicas, que frecuentemente tienen pequeños bucles y torceduras en los extremos.  Algunas otras escrituras de pueblos de ese área geográfica también usan este tipo de caracteres que parecen un poco demasiado elaboradas. La razón es que fueron  pensados para escribirse usando materiales que requerían que las líneas fueran 'cerradas' de alguna forma. Muchas lenguas de la India se escriben con un silabario llamado devanagari, el cual funciona así: el símbolo básico representa una sílaba con la vocal a (pa, ta, sa, ra, etc.). Por medio de signos diacríticos se puede cambiar la vocal por otra. Si se requiere la consonante sola, se utiliza otro signo diacrítico, el "matavocales", que se  llama virama. El sistema base, con signos que implican una "vocal inherente", lleva el nombre genérico de abugida. Todo esto se reduce a un principio: para inventar un alfabeto, tenés que saber sobre qué se va a escribir y por qué medios. Inventar un alfabeto es simple, pero un silabario (o ideogramas) puede ser un dolor de cabeza, así que tendrías que meditarlo cuidadosamente antes. Los ideogramas  son probablemente la peor forma de escritura (en términos de practicidad), y probablemente no deberías usarlos a menos que tengas memoria fotográfica. Los  silabarios están muy bien, pero funcionan mejor en lenguajes muy restringidos; el español, por ejemplo, tiene un número bastante grande de sílabas posibles, e inventar  un signo para cada una sería casi imposible. Si te parece, echále una mirada a algunas escrituras de lenguajes naturales en Ancient Scripts [en inglés], una página con ejemplos de todo el mundo.

El orden del sistema de escritura
Estamos acostumbrados a tener las letras en orden. Esto es muy útil para diccionarios y guías de abonados telefónicos, y para los índices en generales. ¿Cómo vas a  ordenar tus símbolos? Los alfabetos occidentales derivados del alfabeto latino usualmente siguen un orden predecible. El inglés, que es probablemente el más reducido y simple de todos, usa  un conjunto pequeño de símbolos, y los digrafos no se consideran símbolos independientes; pero esto no es así en otros lenguajes. Por ejemplo:

l

l l l

El alfabeto español consiste de todas las letras del alfabeto inglés (que conocemos por ser el set estándar ASCII), más las siguientes: ch (después de c), ll (después de l), y ñ (después n). Así que una palabra como chico no se encuentra en la sección de la C. ¿Tu lenguaje usa un derivado del alfabeto latino? ¿Qué  símbolos extra usa, y cuáles tienen lugar propio en el alfabeto?  El finés pone las vocales con Umlaut ä y ö después de la y . En holandés, el digrafo ij todavía se considera a veces un símbolo independiente (¡las máquinas de escribir antiguas tienen una tecla para él!).  En sueco, la v y la w se consideran dos versiones de la misma letra, así que ambas caen en la sección de la V en las listas alfabéticas. Esto causa grandes  problemas dada la gran cantidad de palabras inglesas y alemanas con w que han sido tomadas por el sueco (el cual usa solamente v para palabras nativas).

Algunos otros lenguajes, que usan escrituras no latinas, ordenan sus caracteres de forma distinta. Algunos usan las características fonéticas de los sonidos para ordenar  las letras; por ejemplo, primero los labiales (p, b, m, f ), luego los alveolares (t, d, n, s) y así. En cuanto a los silabarios, también hay generalmente un orden fijo. En japonés, ambos tipos de kana se disponen así: primero las vocales, a i u e o, luego las sílabas  que comienzan con k (ka, ki, ku, ke, ko), luego t-, n-, h-, m-, y -, r-, w-, y finalmente el símbolo para la n silábica. Otro orden, más tradicional, se usaba en tiempos  antiguos (y todavía se usa en índices y tablas, por oposición al moderno, que se usa en diccionarios). Este orden sigue el de un poema del monje budista Kuukai, que  usa cada carácter hiragana exactamente una vez: Iro ha nihohe to chirinuru wo waka yo tare so. Tsune naramu uwi no okuyama kefu koete asaki yume mishi wehi mo sesu. (Nota: esto probablemente no es japonés moderno correcto, ni ésta es la pronunciación correcta. El kana de ha, donde aparece aquí, se pronuncia wa, y los de wi y we son obsoletos. El de wo se pronuncia o.) En cuanto a los ideogramas, los kanji japoneses (y los hanzi chinos) se ordenan por número de radical y, dentro del mismo radical, por el número de trazos que se  usan para escribirlos (hay un método para contarlos apropiadamente). Sería una buena idea tener letras con nombres que signifiquen algo, o que puedan ser recitadas en orden. Las letras latinas tienen nombres sin sentido en todos los  lenguajes que las usan, y esos nombres son muy similares entre sí; de ahí la necesidad de códigos como 'Alpha, Bravo, Charlie'... Otros lenguajes y escrituras no tienen  este problema.

Gramática
En esta sección tomaré algunos temas gramaticales y los desarrollaré, mostrando con ejemplos, cuando sea posible, cómo los manejan lenguajes naturales, y qué  podés hacer sobre ellos. No se puede tener un lenguaje sin gramática; si no pensás en eso, seguramente vas a terminar copiando la estructura de tu propio lenguaje, y  todo no va a pasar de un ejercicio de traducción de palabras sueltas.

Tipología morfológica
La categorización clásica divide a las lenguas en inflexivas, aglutinantes, y aislantes. Esta categorización se ha probado muy limitada, pero la voy a explicar porque  es un buen comienzo para entender las diferencias. Inflexión Un lenguaje inflexivo usa inflexiones, las cuales son afijos usados, por ejemplo, para conjugar verbos, declinar sustantivos y otras cosas. Algunos lenguajes usan sufijos para esto, mientras que otros usan prefijos o incluso infijos. Algunos ejemplos del español son la -s usada para pluralizar sustantivos, y las terminaciones -aba, abas, -ábamos del tiempo pasado de los verbos. Otro tipo de inflexión (más 'puro', si es posible) es el cambio de las raíces de las palabras. Por ejemplo, la inflexión de los verbos ingleses como sing, pasado sang, participio sung, que son inflexiones de un concepto radical abstracto sing. La inflexión por cambio vocálico es bastante común en ciertas lenguas. El cambio  consonántico también existe, pero es más raro. También en inglés hay ejemplos: pares como breath /brET/ 'aliento' vs. breathe /briD/ 'respirar' (donde /T/ cambia de sorda a sonora /D/, además de alternarse la vocal), house 'casa' vs. house 'albergar' (cambia /s/ por /z/). La inflexión incluye también el cambio de tono, de acento, de altura o longitud de una vocal, o repetir una parte de la raíz. Lo principal es que una inflexión puede tener  más de un significado al mismo tiempo. Por ejemplo, en español, la -í de viví es una inflexión que une tiempo pretérito indefinido, primera persona del singular, modo  indicativo. Ejemplos de lenguajes inflexivos son el inglés, el español, el alemán, el latín, el griego, y en general todos los lenguajes indoeuropeos. Aglutinación Un lenguaje aglutinante usa afijos cuyo significado es único, y que se concatenan uno después del otro sin fundirse. Algunos lenguajes aglutinantes conocidos son el  quechua y muchos otros lenguajes nativos americanos, el turco, el finés, y el húngaro. Por ejemplo, en la palabra quechua wasikunapi 'en las casas', el sufijo de plural kuna está separado del caso locativo -pi . En finés, huoneissansakaan significa '(ni) siquiera en sus habitaciones', y consiste de cinco morfemas aglutinados, 'habitación-es-en-sus-siquiera'. Aislación Un lenguaje aislante no usa afijos ni modificaciones de la raíz. Cada palabra es invariable, y los significados se modifican insertando palabras adicionales, o se  entienden por contexto. El más conocido ejemplo de lenguaje aislante es el chino. En chino (mandarín), un sustantivo por sí mismo no es singular ni plural, y un verbo  no tiene tiempo ni persona; estas distinciones se hacen (cuando hace falta) añadiendo cuantificadores, adverbios o pronombres. En efecto se dice 'libros' diciendo algo  parecido a 'varios libro'.

Análisis y síntesis
La clasificación moderna de las gramáticas es una escala continua que va desde analítico a sintético. Cuanto más analítico un lenguaje, menos significado tienen las  palabras por sí solas, y más importante es el contexto. Cuando más sintético es un lenguaje, más autocontenidas son las palabras. Los lenguajes más analíticos  dependen del contexto y del orden de las palabras para expresar significados, mientras que los sintéticos tienden a declinar (añadir inflexiones a) las palabras. Esta escala se toma como referencia; no hay puntos extremos, pero se pueden comparar dos lenguajes y decir que uno es más sintético que el otro. El chino mandarín  es muy analítico; una palabra china sola puede significar muchas cosas, porque no se hacen distinciones en ella: no se sabe si es un verbo, un sustantivo o un adjetivo, o  si es pasado o futuro, o plural, o singular, o nada, solamente se tiene el concepto raíz. Algunos lenguajes nativos americanos como el nootka o el chinook son el otro  extremo, tan sintéticos que de hecho se los llama polisintéticos, y declinan de tal forma las palabras que una sola puede significar 'los muchos pequeños fuegos que  estuvieron encendidos en la casa' (esto no lo estoy inventando; la palabra es inikwihl'minih'isit, y de hecho ni siquiera es un verbo o sustantivo aún; necesita prefijos  nominales o verbales...). En el medio tenemos el japonés (bastante analítico excepto en los verbos), el inglés (muy analítico, ya que apenas distingue caso en los  sustantivos o persona en los verbos), el español, el francés, el italiano, el alemán (ya con muchas inflexiones) y todos los lenguajes aglutinantes, que son de hecho un  subconjunto de los inflexivos; el latín, el griego, el sánscrito... Así que vas a tener que elegir un punto en la escala y quedarte allí. Ésta es probablemente la más importante decisión del proceso. Cada tipo de gramática tiene sus  pros y sus contras.
l

l

l

Un lenguaje aislante evita mucho trabajo en asuntos difíciles como decidir cómo pluralizar sustantivos y conjugar verbos. Pero requiere que planees un orden  de palabras rígido y que lo respetes a toda costa, después de asegurarte de que no conduce a ambigüedades (serias). Y un lenguaje totalmente aislante es difícil  de crear, ya que hay que eliminar todo rastro de inflexión, aun aquellos de los que nunca sospecharías.  Un lenguaje aglutinante implica un cuidadoso plan de afijos (docenas de ellos) que deben tener significados únicos. También tenés que decidir en qué orden  aparecerán después o antes de una raíz. Finalmente, los lenguajes aglutinantes pueden producir palabras muy largas, o que son muy difíciles de pronunciar  (considerá el georgiano, donde muchos afijos están formados por sólo una o dos consonantes; a veces tienen que unirse a otros afijos del mismo tipo, y terminás  teniendo hasta seis consonantes seguidas). Un lenguaje inflexivo produce palabras más cortas y oraciones compactas (cuanto más inflexivo, más compactas), pero requiere que planees todas las  inflexiones y combinaciones de significados, porque a veces no vas a poder colocar dos o más seguidas (aglutinadas). Se puede tener una inflexión mínima  (como la del inglés) o producir un lenguaje polisintético que declina las palabras para casi cualquier propósito concebible. Cuanto más inflexivo es un lenguaje,  más vas a tener que tener cuidado con la concordancia (el acuerdo entre adjetivos y sustantivos, y entre sustantivos y verbos). 

La clasificación de Sapir
Hay otra clasificación de lenguajes, que es mucho más compleja, y fue creada por Edward Sapir en los años 1920. Divide los conceptos en cuatro clases: Grupo I. Conceptos básicos (concretos) (objetos, acciones, cualidades): expresados normalmente mediante palabras o elementos radicales independientes; no denotan ninguna relación propiamente dicha. Grupo II. Conceptos derivativos (por lo general menos concretos que el grupo I, pero más concretos que el grupo III): expresados normalmente mediante la  afijación de elementos no radicales a los elementos radicales, o mediante una modificación interna de estos últimos; difieren del grupo I porque denotan ideas que no  interesan al conjunto de la proposición u oración, pero que dan a un elemento radical un incremento particular de significación y que, de ese modo, están íntimamente  relacionadas, de una manera concreta, con los conceptos del grupo I. Por ejemplo, los prefijos pre -, in-, des- y los sufijos -mente, -ito. Grupo III. Conceptos concretos de relación (más abstractos aún, pero no totalmente desprovistos de un matiz concreto): expresados normalmente mediante la  afijación de elementos no radicales a los elementos radicales, pero, por lo común, de manera menos íntima que los elementos del grupo II, o mediante una modificación  interna de los elementos radicales; difieren fundamentalmente del grupo II porque indican o dan a entender relaciones que trascienden la palabra particular a la cual van adheridos de manera inmediata. Por ejemplo, la -s del plural de los sustantivos. Grupo IV. Conceptos puros de relación (totalmente abstractos): expresados normalmente mediante la afijación de elementos no radicales a los elementos radicales  (y en tal caso estos conceptos suelen entremezclarse con los del grupo III), o por su modificación interna, o por palabras independientes, o por la posición en la frase;  sirven para relacionar entre sí los elementos concretos de la proposición, dándoles así una forma sintáctica definida. Por ejemplo, las modificaciones de le, la, te de él,  ella, tú que indican caso acusativo; las preposiciones a, para; la posición de "el perro" en "Veo al perro" indicando que es el objeto del verbo, etc. La clasificación de los lenguajes con respecto a estas clases es como sigue: Tipo A. Lenguajes que sólo expresan conceptos de los grupos I y IV, de manera que no tienen medios para modificar el significado de un elemento radical (o raíz) por  medio de afijos o cambios internos. Por ejemplo, el chino. Tipo B. Lenguajes que expresan conceptos de los grupos I, II y IV, preservando las relaciones sintácticas en forma pura (fuera de la palabra) y capaces de modificar  el significado de las raíces por afijación o cambio interno. Tipo C. Lenguajes que expresan conceptos de los grupos I y III, es decir, en los cuales las relaciones sintácticas se expresan en conexión necesaria con conceptos no  totalmente desprovistos de significado concreto, pero que, si se prescinde de esa mezcla, no tienen la facultad de cambiar el sentido de sus elementos radicales por medio de afijos o de cambios internos. [El grupo III absorbe al grupo IV.] Tipo D. Lenguajes que expresan conceptos de los grupos I, II y III, es decir donde las relaciones sintácticas se expresan de forma mezclada, como en el tipo C, y que  también pueden modificar el significado de los elementos radicales por afijación o cambio interno. A este grupo pertenecen la mayoría de los lenguajes inflexivos con  los que estamos familiarizados, como así también muchos de los aglutinantes. Cada uno de los tipos A, B, C, D se puede subdividir en aglutinante, fusional y simbólico. Aglutinante significa que las cosas añadidas a la raíz están simplemente  yuxtapuestas (puestas juntas); fusional significa que a veces se funden; simbólica implica, aproximadamente, cambio interno de la raíz. El tipo A también tiene un  subtipo aislante. El método (aglutinante, fusional o simbólico) de un cierto grupo de conceptos no tiene por qué ser igual al método de un grupo diferente. La clasificación usa un  término compuesto, la primera parte del cual se refiere al método para los conceptos de grupo II, y la segunda a los conceptos de los grupos III y IV. Estos métodos  no están solos; el inglés, por ejemplo, los usa todos (aunque algunos predominan y otros son marginales). Por ejemplo, goodness 'bondad' de good 'bueno' es

aglutinación; books 'libros' de book 'libro' es fusión regular, depth 'profundidad' de deep 'profundo' es fusión irregular, y geese 'gansos' de goose 'ganso' es fusión  simbólica o simbolismo. El español no usa la fusión simbólica y prefiere fundamentalmente la fusión regular. Todo esto conduce a una sola cosa: no tenés por qué esperar que todo esté en su lugar 'correcto' en tu lenguaje (es decir, en el mismo lugar que en español). El  número en español (singular vs. plural) es un concepto del grupo III, bastante abstracto y que forma parte íntima de las palabras; no concebimos una palabra sin  número. En tibetano, sin embargo, el número es una característica opcional y no está gramaticalizada como en español; no es una cosa abstracta que debe incluirse en  la palabra, sino una cosa concreta, la idea de pluralidad: 'varios' o 'muchos' se expresa por una raíz que es una palabra separada y con todas las de la ley, un concepto  del grupo I. No es parte obligatoria de la sintaxis y por lo tanto se omite cuando no se necesita. Pensá mucho sobre esto. Después de colocar tu lenguaje en la escala, tenés que decidir qué clases de palabras vas a usar, y cómo se relacionarán unas con otras.

Sustantivos
Número
La distinción de número no está restringida a singular-plural; muchos lenguajes tienen formas especiales para pares de cosas (número dual) y algunos para grupos de  tres (trial). Ciertos lenguajes tienen un número paucal (del latín paucum  'poco'), que se usa para plurales de pocos objetos (generalmente no más de diez),  reservándose el plural simple para cantidades más grandes. Podrías tener un singular que se refiere a un objeto realmente único, o plurales que distingan las cosas que se ven ('estas casas') o todas las cosas de ese tipo ('las  casas' en general). Tu imaginación es el único límite. Pero también podés dejar el número fuera del sistema. Esto es lo que hacen el japonés, el chino y la mayoría de las otras lenguas de Asia Oriental. En caso de  necesidad, y si el contexto no es suficiente, se puede usar una partícula o adjetivo similar a 'varios' o 'muchos' para expresar la idea de pluralidad. Si usás una inflexión para marcar el plural, no hace falta que sea un sufijo corto; puede ser relativamente largo (como el quechua -kuna) o puede ser un prefijo, o un infijo, o aparecer como un cambio vocálico interno. Muchos lenguajes marcan el plural de ciertas clases de objetos por reduplicación, es decir repitiendo la palabra o  su primera o última sílaba (en Bahasa Indonesia se dice baterei-baterei 'baterías'; en japonés, hitobito 'gente' como una reduplicación ligeramente modificada de hito 'persona'). Los plurales ingleses de palabras como man, goose, mouse (men, geese, mice) son ejemplos de cambio de una vocal por otra, conocido como gradación o  alternancia vocálica. La misma resultó de un cambio fonético (Umlaut) originalmente condicionado por la presencia de un sufijo de plural, que se perdió más tarde.

Género
Género es el término común que designa al concepto general de clase (nominal). El género no tiene por qué ser una oposición masculino-femenino. El alemán, el griego  y el latín tienen tres géneros: masculino, femenino y neutro. El swahili tiene clases nominales (géneros) distintas para animales, para seres humanos, para sustantivos  abstractos, etc. Muchos lenguajes hacen una distinción de género entre objetos animados e inanimados (personas y animales vs. plantas y objetos no vivientes, o  similar). Las clases nominales pueden ser más o menos arbitrarias. En las lenguas indoeuropeas usualmente no hay relación entre el género y el objeto real (el género no tiene  significado, es convencional). Aunque mesa en español es femenino, no sólo no tiene absolutamente nada de femenino, sino que tampoco tiene nada en común con  otros sustantivos de género femenino, como comadreja o crisis... La distinción animado-inanimado tiende a ser menos arbitraria, pero siempre hay casos límite e  idiosincracias culturales particulares (por ejemplo, algunos lenguajes pueden tomar fuego como sustantivo animado). En los casos en que hay muchas clases que tienen contenido semántico (como en las lenguas bantúes), puede suceder que algunos sustantivos cambien de significado pero permanezcan en la misma clase, ahora  'incorrecta' para ellos (supongamos que se tiene una clase nominal para objetos redondos o curvos, y la palabra arco pasa a significar 'rectángulo por donde debe  pasar la pelota para marcar un gol en el fútbol', como en español...).

Caso
En un sentido estricto, un caso gramatical es una marca inflexiva de la función de un sustantivo en la oración. En un sentido más amplio, es el rol del sustantivo en la  oración (marcado de la forma que sea). No hay un conjunto fijo de casos posibles; cada lenguaje distingue uno o más casos morfológicamente marcados y los usa  para determinados propósitos. Sin embargo, algunos casos que presentan funciones comunes en muchos lenguajes reciben siempre el mismo nombre. El latín tiene los siguientes casos, marcados por inflexiones: nominativo, acusativo, genitivo, ablativo, dativo, y vocativo. Un sustantivo está en caso nominativo cuando  es el sujeto de una oración; acusativo, cuando es el objeto directo; dativo cuando es objeto indirecto; genitivo cuando es posesivo; ablativo cuando es parte de un  complemento verbal; y vocativo cuando muestra una llamada. El español no tiene casos morfológicos (podemos hablar de casos sintácticos, marcados por orden de  palabras y por preposiciones). El inglés tiene un caso genitivo marcado por la partícula 's. Ambos además distinguen entre formas sujeto y formas objeto de los  pronombres (en español, yo vs. me, él vs. le, etc.). Tu lenguaje puede tener más casos; el estonio tiene 14, y el finés aún más (unos 18, creo). La mayoría de estos  casos son locales (es decir, se refieren a posiciones y direcciones: en, sobre, debajo, alrededor, dentro, al lado, desde, hacia, etc.). Algunos casos se usan luego de ciertas preposiciones (se dice que la preposición 'gobierna' el caso). Mi lenguaje Stālāg tiene un caso base o absoluto (usado para sujetos y objetos, que son diferenciados además de otras maneras) y un caso oblicuo (que se usa como genitivo o compositivo/asociativo, y con todas las  posposiciones).

Adjetivos
Con los adjetivos entramos en la tierra de las posibilidades. Podés elegir tener adjetivos (como clase de palabras separada), o no. Los adjetivos pueden ser una clase  enteramente distinta de las otras, como en inglés; o pueden ser un subconjunto de los sustantivos (en morfología y costumbres), como en español o latín; o pueden  comportarse como verbos (como en japonés). Examinemos estas alternativas. Si son una clase completamente aparte, los adjetivos no tienen por qué comportarse como algo más; pueden tener sus propias reglas de inflexión, o no tener inflexión  alguna. Los adjetivos del inglés son un ejemplo de esto: son palabras invariables, excepto (en los adjetivos cortos) por la forma comparativa y superlativa.

Si son como sustantivos, o un subconjunto de éstos, entonces se comportan como sustantivos. En español, donde los sustantivos tienen género y número, los adjetivos  también los tienen, y deben concordar con su sustantivo. Muchas veces, gracias a esto, pueden transformarse en sustantivos sin cambiar; rojas puede ser tanto adjetivo ('quiero rosas rojas') como sustantivo ('déme de las rojas') en cuanto a sintaxis y morfología. Curiosamente, algunos sustantivos pueden funcionar como  adjetivos en el uso coloquial (por ejemplo, he escuchado muchas veces la frase ¡Es tan payaso!. En latín, los adjetivos concuerdan con su sustantivo modificado aún  en caso gramatical. En japonés, los adjetivos de una clase particular (adjetivos na) se comportan como sustantivos; se colocan antes del sustantivo que modifican, seguidos por na, que es la forma relativa de la cópula 'ser'. Por ejemplo: kirei na kimono 'hermoso kimono' -- el adjetivo nominal (o sustantivo calificativo, como se lo llama también), kirei, significa 'hermoso' o 'hermosura', y la frase podría traducirse como 'un kimono que es hermoso / que posee hermosura'. Se puede añadir tiempo a la expresión  marcando el tiempo en la cópula: kirei datta kimono 'un kimono que era hermoso'. Si los adjetivos son como verbos, se conjugan como tales. Otra clase de adjetivos japoneses (adjetivos i, porque todos terminan en -i) funcionan de esta manera; son generalmente una especie de forma participial de los verbos, o bien una cláusula relativa de palabra única (las cláusulas relativas del japonés vienen antes de lo que  modifican, al igual que adjetivos y demostrativos). Puede pensarse en los adjetivos japoneses como una combinación de un adjetivo en español + la cópula 'ser',  aunque los adjetivos japoneses pueden tomar, y toman, la cópula a veces. Pero el tiempo sigue estando en el adjetivo, no en la cópula. Por ejemplo: Kakkoii desu 'Él  es lindo' (forma cortés); Kakkoikatta desu 'Él era lindo'. Aquí kakkoi- es la raíz, mientras que -i es el sufijo para adjetivos en tiempo presente, -katta es para el tiempo pasado, y desu es la forma cortés en tiempo presente de la cópula. Como se ve, el tiempo en esta clase va directamente en el adjetivo, no en la cópula, que  puede omitirse a veces. También puede ocurrir simplemente que los adjetivos no se diferencien para nada de los verbos, como ocurre en mi lenguaje draseléq. En él hay verbos que significan  'ser grande', 'ser amarillo', e incluso 'ser cuatro'. Se dice 'un árbol alto' diciendo 'un árbol siendo-alto', donde 'siendo-alto' es el participio activo del verbo 'ser alto'. Se puede decir 'el árbol es alto' usando 'el árbol' como sujeto del verbo 'ser alto', que se conjuga en tercera persona del singular. Lo mejor de esto es que se pueden  fundir dos clases de palabras en una, y cualesquiera medios expresivos que se usen para una sirven para la otra. En draseléq, por ejemplo, se puede decir 'Nos  hicimos cuatro (personas)' en una sola palabra. [Si tenés que saberlo: la palabra es tenenrrednüat, ten- reflexivo, en- causativo, rred(n)- 'cuatro', -(n)üat primera persona plural exclusiva, tiempo pasado.] Muchos adjetivos pueden no existir de ninguna forma (aunque todos los lenguajes tienen algunas palabras que actúan como adjetivos). Las ideas de calificación pueden  expresar de otras maneras. El tibetano usa sustantivos abstractos en vez de adjetivos; no hay un adjetivo 'grande', pero sí un sustantivo 'magnitud, tamaño', y 'una  habitación grande' se puede expresar como 'una habitación de magnitud'. Esto no es ridículo en español; 'un desastre de proporciones', que sigue una estructura similar,  es una expresión conocida y común. En algunos lenguajes, los adjetivos forman una clase cerrada; hay un cierto número (pequeño) de ellos, generalmente pares opuestos como 'grande/chico' y los colores)  y no se pueden formar otros adjetivos. Si tenés en tu lenguaje una clase morfológicamente separada para los adjetivos, deberías crear algunos afijos (u otros medios) para colorear su significado, para  negarlos, y para transformarlos en otras clases de palabras. También tenés que pensar en comparativos y superlativos. No es obligación tenerlos, pero un lenguaje  debería poder expresar ideas tales como la de que algo es más alto, o más rojo, o más feo, que alguna otra cosa. El español es analítico en este caso (usa la frase más + adjetivo). El inglés utiliza un sufijo comparativo y otro superlativo con los adjetivos cortos. El japonés utiliza una adposición para los comparativos, y marca los  superlativos diciendo simplemente ichiban 'número uno, primero'.

Verbos
Persona y número
En muchos lenguajes, el verbo concuerda con uno de sus argumentos (una de las frases nominales de la oración); en los que marcan sujeto y objeto, generalmente el  sujeto. Sin embargo, algunos lenguajes tienen doble concordancia (los verbos en húngaro, por ejemplo, concuerdan con el sujeto y con el objeto a la vez), y en ciertos  casos hay concordancia polipersonal (como en vasco, donde los verbos ditransitivos llevan marcado el sujeto, el objeto directo y el objeto indirecto). En otros lenguajes, el verbo concuerda con la frase nominal que esté un caso particular (el nominativo en lenguajes nominativo/acusativos, el absolutivo en los  ergativo/absolutivos). En más de un lenguaje no hay ninguna concordancia: el inglés apenas distingue la tercera persona del singular en presente de las demás; el chino y el japonés no marcan  persona ni número en el verbo de ninguna forma.

Tiempo
El sistema de tiempos puede ser cualquier cosa desde una distinción binaria entre presente y no presente, hasta una estructura muy compleja. El único tiempo universal  es el presente. Suele haber una distinción básica entre eventos pasados y no pasados, esta última englobando el presente y el futuro. Muchas lenguas no tienen un  tiempo futuro marcado morfológicamente en el verbo. Por ejemplo, el inglés usa un auxiliar, will, que de hecho significa también 'querer' o 'tener la intención de', y el  verbo queda en infinitivo. El español tiene un tiempo futuro que proviene de una fusión del infinitivo más formas de haber, habiendo perdido el futuro latino original (perderé proviene de perder he , es decir he de perder), y va firmemente en camino de perder este tiempo futuro sintético, que está prácticamente obsoleto en el  discurso coloquial (reemplazado por una perífrasis con ir a) y apenas se usa para expresar incertidumbre ("vendré mañana o pasado"). Se pueden tener varios tipos de presente, pasado o futuro. El español tiene dos pasados, el pretérito imperfecto (para acciones que ocurrieron en un período del  pasado) y el indefinido (que muestra acciones terminadas, sin considerar su duración), aunque esta distinción es formalmente una de aspecto. Algunos lenguajes no  usan marca de tiempo nunca, sino adverbios o frases adverbiales ('hoy', 'mañana', 'hace una semana') para marcarlo cuando haga falta.

Aspecto
Del sitio Invisible Lighthouse, de Richard Harrison (traducido libremente): "El aspecto se refiere a la constitución temporal interna de un evento, o la manera en que la  acción verbal se distribuye a través del continuo espaciotemporal. El tiempo, en cambio, señala la ubicación de un evento en el continuo de eventos." En muchas  descripciones de gramática tradicionales, el tiempo y el aspecto (al igual que el modo) se toman como una unidad; por ejemplo, lo que se llama 'pretérito indefinido' en  español es en realidad un tiempo pasado junto con un aspecto perfectivo. Los verbos pueden declinarse para mostrar que el énfasis es en el proceso (progresivo), o la acción en sí, o una acción habitual, o una acción repetida, o el comienza o  fin de una acción, etc. Algunos lenguajes tienen docenas de estos aspectos. Un par interesante es la distinción entre estático y dinámico. Una forma estática describe 

un estado particular, mientras que una dinámica muestra un cambio de estado. Por ejemplo, en árabe, rukubun significa 'cabalgar' en forma estática, y 'montar' en su  forma estática. El japonés tiene un aspecto condicional, pudiendo declinar un verbo para transformarlo en cláusula condicional: nobasu 'extender' produce nobaseba 'si yo extiendo'. Perfectividad La perfectividad o compleción es un aspecto que depende de si la acción está completada (desde el punto de vista del que habla) o no. La acción completada se llama  perfecta (por ejemplo 'He llegado') y la no completada imperfecta ('Estoy llegando').

Modo
El modo, por oposición al aspecto, se refiere más a la actitud del hablante que a la forma del evento en sí. Se refiere, por ejemplo, a si la acción es real y cierta  (indicativo), o es dudosa o deseable (subjuntivo), o no sucede en realidad (negativo), etc. El modo indicativo es el más común y el menos marcado. En español y otros lenguajes romances se usa el subjuntivo (entre otras cosas) para acciones hipotéticas y para expresiones de deseo. El inglés no distingue entre indicativo y subjuntivo, y usa un auxiliar para negar el verbo. El japonés declina los verbos para negarlos (keru 'patear', keranai 'no patear'), mientras que el finés utiliza un verbo auxiliar conjugado (ei) junto con una forma del verbo principal. También está el modo imperativo, que se usa para dar órdenes o hacer pedidos. Estos modos, por supuesto, no son los únicos. Nenets, un lenguaje siberiano  (urálico/samoyédico), tiene muchos modos (algunos son en realidad aspectos): indicativo, imperativo, hortativo ('dejáme hacer'), optativo ('que él haga'), conjuntivo ('él  lo hará' [pedido]), necesitativo ('él debe'), interrogativo ('¿Lo hizo?'), probabilitativo ('quizá lo haga'), obligativo ('debería hacerlo'), aproximativo ('parece que hace'),  superprobabilitivo ('probablemente lo haga'), hiperprobabilitivo ('seguramente lo ha hecho'), reputativo ('se supone que debe hacerlo'), habitivo ('acostumbra hacerlo').

Evidencialidad
Se refiere a cómo el hablante sabe lo que está diciendo. Puede ser por experiencia personal directa, o de oídas, o simplemente una idea que le parece probable. El  quechua, el aymará y muchos otros lenguajes nativos americanos (y otros) distinguen estos aspectos con diferentes niveles de sutileza. También se los llama 'niveles de  experiencia', y Umberto Eco llama al sistema del aymará 'lógica trivalente' (es decir, no basada en nuestra lógica binaria 'verdadero' contra 'falso', sino con niveles  intermedios).

Estructura argumental
Los argumentos de un verbo son las partes de la oración (generalmente frases nominales) que éste une y que están en relación gramatical cercana con él. En general  esto significa el sujeto y (si están presentes) el objeto directo y quizá un objeto indirecto. El número de argumentos de un verbo se llama valencia (por analogía con la valencia de los elementos químicos, que es la cantidad de átomos de otros elementos que  se pueden enlazar a un átomo del elemento dado). Valencia Tipo de verbo Ejemplo 0 impersonal "Llueve." 1 intransitivo "Él corre." 2 transitivo "Ella comió lechuga." 3 ditransitivo "Les dimos regalos." En inglés y francés, por dar un ejemplo, todos los verbos deben tener algo que ocupe el lugar de un sujeto, aun en el caso de verbos como 'llover', así que 'llueve' en  francés se dice il pluie, y en inglés it rains; es decir, la valencia mínima de un verbo es 1 y se usa como sujeto un pronombre que no designa nada en realidad. La mayoría de los lenguajes no distinguen entre verbos transitivos e intransitivos con inflexiones en el verbo (morfológicamente), pero por ejemplo el húngaro tiene  diferentes conjuntos de inflexiones de persona/número (paradigmas) para los verbos transitivos y para los intransitivos. Las formas reflexivas son un caso especial. Algunos lenguajes las marcan en el verbo, mientras que otros pueden usar pronombres reflexivos (el español utiliza los  pronombres objeto como reflexivos cuando es necesario, a veces con el añadido de mismo). En algunos lenguajes, además, los pronombres objeto (y/o los sujetos) son incorporados en el verbo (el español añade los pronombres clíticos de objeto a los verbos,  aunque esto no es inflexión). Algunos lenguajes son más rígidos que otros con respecto a la estructura argumental de los verbos. Por ejemplos, puede exigirse que los verbos transitivos lleven  siempre un sujeto explícito. Compárese esto con la libertad del español, y en mayor medida, del inglés, donde muchos verbos transitivos pueden aparecer sin objeto  ('comer', 'escribir', etc.). En inglés, además, muchos verbos son intercambiablemente intransitivos o transitivos/reflexivos (burn 'quemar algo' o 'quemarse', stand up 'dejar plantado' o 'pararse').

Voz
El concepto de voz se puede entender desde dos puntos de vista: el sintáctico y el semántico. El punto de vista semántico se refiere a lo que representa la voz para el  significado del verbo y la oración. En español, por ejemplo, uno puede enfocar la acción en el sujeto (voz activa) o en el objeto (voz pasiva). Un perro me mordió es voz activa (focalizada en un perro), mientras que Fui mordido por un perro es voz pasiva (focalizada en el sujeto tácito yo ). Desde el punto de vista sintáctica, la voz cambia la forma en que se estructuran el sujeto y el objeto (los argumentos). Así, el cambio de voz es una operación  gramatical que desplaza argumentos de su lugar original y puede incrementar o disminuir la valencia del verbo. En las construcciones de voz pasiva en español, el  objeto original se transforma en sujeto (es promovido), mientras que el sujeto original se transforma en complemento opcional (es degradado). El español, el inglés y otros lenguajes usan una construcción perifrástica con el verbo ser y un participio verbal (y por lo tanto no tienen distinción morfológica de voz 

verbal, aunque sí distinción sintáctica). Los verbos latinos, por otra parte, se pueden declinar para cambiar de voz: curare 'curar', curantur 'son curados'. Activa y pasiva no son las únicas distinciones de voz. El griego tenía una voz media, que sugería una acción realizada por el sujeto en beneficio propio. Desde el punto  de vista semántico, las construcciones seudorreflexivas del español tienen un valor de voz media (o mediopasiva): La carne se vende bien, Me voy, Lávese las  manos, son todos ejemplos. Aparte de estas, hay voces más difíciles de definir desde lo semántico, pero que pueden entenderse sin dificultad como dispositivos sintácticos. Por ejemplo, muchos  lenguajes ergativo/absolutivos tienen una voz antipasiva, la cual transforma un verbo transitivo en uno intransitivo ('Yo como carne' se hace 'Yo como'). En estos lenguajes, esto también significa que el sujeto es degradado de ergativo a absolutivo, aunque esto no se hace evidente en la traducción; esto sugiere un cambio de  significado, del de acción (ergativo = agente activo) al de estado (absolutivo = paciente pasivo). En Stālāg, uno de mis lenguajes, hay una voz aplicativa que promueve un complemento oblicuo opcional a la posición de objeto, con una marca especial en el verbo  que muestra la función general del complemento original (¿se refería a una posición, un destino, una fuente?). Por ejemplo, 'él nada bajo el bote' se transforma en 'él  *sub-nada el bote'. En Stālāg hay también una especie de voz antipasiva que actúa sobre verbos intransitivos con complementos, promoviendo un complemento a la  posición de sujeto y degradando el sujeto original: 'el gato duerme sobre la alfombra' se transforma en 'la alfombra *sobre-duerme al gato'.

Deferencia
Muestra el grado de deferencia (o necesidad de cortesía) entre el hablante y el oyente. En ciertos lenguajes, hay formas diferentes de verbos y pronombres para hablar  a un subordinado, a un igual y a un superior. Los verbos japoneses se declinan para mostrar cortesía: hanasu 'hablar', en forma cortés hanashimasu. El japonés tiene  otras formas más y menos formales y corteses para dirigirse a otras personas según su sexo y posición social, en distintas ocasiones.

Rarezas
Algunos verbos muy comunes en español no se encuentran en otros lenguajes, como 'tener'. Muchos lenguajes reemplazan 'Yo tengo un libro' por perífrasis como 'Un  libro es a mí', o 'conmigo', o 'junto a mí', o algo similar. En el caso de 'tener', además, hay lenguajes que distinguen (verbos y pronombres) entre posesión alienable o  accidental (que no es inherente al objeto), como 'mi libro', y posesión inalienable (que es parte de la esencia del objeto y no puede cambiar), como 'mi carácter' o 'mi  padre'. Algunos verbos pueden ser usados como palabras gramaticales más allá de su estado original. Por ejemplo, en khmer se usa el verbo 'dar' como equivalente del  significado de la preposición 'a' o 'para', para marcar objetos indirectos. Y en ainu, las formas conjugadas del verbo 'tener' se usan como marcas posesivas. Por  ejemplo:
kukor kunupe kunukar rusuy 1s.tener 1s.hermano 1s.ver querer 'Quiero ver a mi hermano'

(nótese que el prefijo de primera persona singular, 1s, se coloca ante verbos y sustantivos). Dado esto, no es imposible pensar en un lenguaje donde los pronombres posesivos no existen, ni se forman a partir de los pronombres personales, sino que son cláusulas subordinadas consistentes en formas conjugadas del verbo 'tener' (en  vez de 'mi hermano', digo 'el hermano que tengo'). En japonés, los verbos se usan a veces en lugar de adjetivos, aprovechando el hecho de que las cláusulas subordinadas se colocan antes que el sustantivo modificado  (igual que los adjetivos). Por ejemplo: sabitsuita kokoro 'corazón oxidado' (sabitsuita 'se oxidó'), takanaru mirai 'futuro exaltado' (takanaru 'sube, se eleva').

Conjunciones
Las conjunciones son palabras que juntan partes de la oración. Algunas conjunciones comunes en español son y, o, si, pero, etc. Se pueden incluir algunas distinciones en las conjunciones que no están presentes en español; por ejemplo, la diferencia entre o inclusivo y exclusivo (lo que en lógica de Boole se expresa  como OR y XOR). En latín, se puede decir vel X vel Y ('X o Y' inclusivo, o sea uno u otro o los dos') o bien aut X aut Y ('X o Y' de forma excluyente, o sea uno u otro, pero no los dos al mismo tiempo). Las conjunciones pueden a veces transformarse en otras cosas; por ejemplo, en latín, además de et 'y', se puede usar una partícula pospuesta, -que, para unir dos sustantivos: Senatus Populusque Romae 'el Senado y el Pueblo de Roma'. Algunos lenguajes no tienen conjunciones; simplemente ponen las cosas juntas. 'X Y' (quizá con una pausa intermedia) puede significar 'X e Y' o también 'X o Y' (dependiendo de otros factores, como el  contexto y la entonación). También se pueden usar casos gramaticales para unir cosas, por ejemplo diciendo 'X junto-con-Y' en vez de 'X e Y', si el significado 'junto con' se expresa con un caso (típicamente llamado comitativo). O se pueden reemplazar las conjunciones por adverbios o frases adverbiales: 'Traté pero no pude' se  transformaría en 'Traté, sin embargo no pude'.

Artículos
¿Tiene artículos tu lenguaje? El español tiene indefinidos (un, una, unos, unas) y definidos (el, la, los, las), que deben concordar en género y número con los  sustantivos. El inglés tiene sólo dos artículos, a y the, y no tiene artículo indefinido plural, ni concordancia. En griego, los artículos no sólo deben concordar en número  y género (femenino, masculino o neutro) sino también en caso, con sus sustantivos. Los lenguajes escandinavos colocan los artículos al final de las palabras, en vez de  al principio (por ejemplo, en sueco, en bok 'un libro', boken 'el libro', böcker 'unos libros', böckerna 'los libros'). Muchos lenguajes no tienen artículos. En la mayoría de los casos, se pueden parafrasear los artículos usando adjetivos, cuantificadores (como algunos, todos) o demostrativos (este, ese, aquel). Los artículos frecuentemente no llevan acentuación y se unen al comienzo de las palabras siguientes (son clíticos), quizás elidiendo vocales o causando otros cambios. En  francés, se dice la voiture 'el automóvil' pero l'avion 'el avión'. En italiano y portugués, los artículos se funden con cualquier partícula (generalmente preposiciones)  que se ponga en su camino. En otros lenguajes, como el galés o el hebreo, el artículo provoca mutación de los sonidos iniciales de los sustantivos (en galés, lenición; en  hebreo, geminación). En árabe el artículo se asimila parcialmente a la consonante inicial de ciertos sustantivos.

Adposiciones y partículas
Las partículas son pequeñas palabras invariables que modifican el significado de otras, o de la oración. Entre ellas encontramos las adposiciones (preposiciones y  postposiciones), que son usadas por la mayoría de las lenguas para modificar el significado de frases nominales y crear complementos (de lugar, tiempo, manera, etc.).

Hay partículas que tienen un rango más amplio de funciones, como las muchas partículas del japonés, algunas de las cuales funcionan como marcas de caso  postposicionales, otra como parte de frases adverbiales, y otras para añadir matices semánticos a la oración entera. Por ejemplo, watashi no 'mi' usa la partícula  genitiva no para marcar watashi 'yo'; la partícula wa marca un nuevo tópico o tema de la oración, que se omitirá (dándose por entendido) en lo sucesivo. Hay incluso  una partícula exclamativa, yo , que añade fuerza a las afirmaciones (como un signo de admiración), y una partícula interrogativa, ka, que sirve para hacer preguntas (Taberu ka '¿Comemos?'); ka también crea deícticos indefidos (itsu 'cuándo', itsuka 'en algún momento'). Un lenguaje puede tener (como clase aparte) preposiciones o postposiciones, o ninguna de las dos (no conozco ningún caso en que se encuentren ambas en el mismo  lenguaje). El que un lenguaje sea preposicional o postposicional depende sobre todo de la posición de las partes de la oración (especialmente los argumentos  verbales). Como regla general, los lenguajes SOV son postposicionales (ejemplo clásico: japonés), y los lenguajes VSO son preposicionales (ejemplo clásico: árabe);  los lenguajes SVO pueden ir para cualquiera de los dos lados. Desde luego, hay muchas excepciones (el latín es SOV y preposicional). Las adposiciones más comunes pueden ser adecuadamente reemplazadas por casos, y quizá por adverbios. El japonés muestra muchas relaciones con partículas  pospuestas que no tienen un significado real, sino muchas funciones aparentemente desconectadas. En algunos casos, cuando se necesita usar el equivalente a una frase adposicional, usa dos sustantivos unidos por la partícula genitiva:
heya no naka heya no naka habitación GEN interior "(en) el interior de la habitación" ki no ue ki no ue árbol GEN parte_superior "encima del árbol"

Esto no es lejano a las construcciones preposicionales perifrásticas del español (debajo de por abajo, encima de por sobre, etc.).

Sintaxis
En términos simplificados, sintaxis es el orden y la estructura de las palabras y frases dentro de una proposición gramatical. Los varios componentes de una oración suelen aparecer en un orden fijo. Cuanto más analítico es un lenguaje, generalmente más fijo es el orden de palabras. Las  sentencias del chino tienen un orden tan estricto que el colocar mal una palabra puede alterar mucho el significado. Cuanto más sintético es un lenguaje, probablemente  más libre sea el orden, porque las palabras sintéticas, con mucha inflexión, pueden permanecer solas y no dependen tanto del contexto. Por ejemplo, en latín Petrus amat Paulum 'Pedro ama a Pablo', el sujeto y el objeto están perfectamente determinados por sus marcas de caso, y sus lugares se pueden intercambiar sin cambiar  el significado de la frase: se puede decir Paulum Petrus amat o amat Petrus Paulum, etc., y estará bien. Pero en español, 'Pedro ama a Pablo' y 'Pablo ama a  Pedro' son cosas diferentes, ya que el orden de las palabras sirve para distinguir sujeto y objeto. Un lenguaje sintético puede tener un orden libre no sólo recurriendo a casos. Me ha sido señalado que otros medios gramaticales como la concordancia (entre verbos  y sustantivos, sustantivos y adjetivos, etc.) pueden también servir a este propósito.

Sujeto, verbo, objeto
La estructura básica de una oración completa incluye sujeto, objeto y verbo. Éstos, por supuesto, sólo pueden ocurrir en seis posiciones relativas diferentes: SVO,  SOV, VSO, OVS, OSV, VOS. El español casi siempre usa SVO, aunque para algunos verbos y expresiones prefiere VSO, y para dar énfasis puede soltar algún  OVS. El inglés es mucho más restringido, casi siempre SVO. Quizá algunos verbos de tu lenguaje puedan usar un orden, y otros otro, o usar un orden distinto para  oraciones largas que para las más cortas. Siempre hay un orden de palabras no marcado, que es un orden particular que no transmite información extra (como el énfasis), y que por lo tanto es 'neutral' para  el que escucha. Por ejemplo, el orden no marcado en español, para casi todos los verbos en oraciones afirmativas, es SVO. Algunos órdenes son más comunes que otros. De acuerdo a estadísticas, SVO y SOV, cada uno, engloban a cerca del 40% de los lenguajes de todo el mundo. Los  lenguajes VSO son también relativamente frecuentes, un 15%. Los otros órdenes (aquéllos donde el objeto precede al sujeto) suman entre todos un 5%. O sea que si  tu lenguaje intenta ser promedio, debería ser SVO o SOV; si la idea es que sea exótico y extraño, podés probar OVS, OSV o VOS.

Núcleos y modificadores
Cada parte de una oración puede dividirse en un núcleo y cero o más modificadores. Un núcleo y sus modificadores forman una frase. Una frase como la pequeña casa roja, donde el núcleo es el sustantivo casa y los modificadores son el artículo y los dos adjetivos, es una frase nominal (que puede  funcionar como sustantivo). Una frase cuyo núcleo es un verbo se llama frase verbal, y de manera similar puede ser modificada por adverbios, otros verbos, etc. En cada caso un lenguaje tiene un orden no marcado para colocar el núcleo y los modificadores. El español coloca los artículos antes de los sustantivos, y los adjetivos  generalmente después; los adverbios también suelen ir después de los sustantivos, y las frases genitivas y adposicionales también. Por lo tanto se lo llama un lenguaje  first , right-branching). El inglés es más bien head-last (con núcleo  con núcleo inicial o con ramificación a la derecha (traduzco aproximadamente del inglés headfinal). Hay que tener en cuenta que estas son tendencias. El español no siempre coloca los adjetivos antes que los sustantivos; hay algunos que van tradicionalmente antes. En  inglés, al igual que en español, se invierte el orden usual en ciertos tipos de discurso (poesía). También hay variación en cuanto a los tipos de modificadores: el inglés  coloca los adverbios antes de los verbos, pero las frases preposicionales y adverbiales (más largas) después. El japonés es más estricto: coloca todos los  modificadores antes de sus núcleos, incluso las proposiciones subordinadas, que actúan como adjetivos:
Kanojo ga dakishimeta otoko wa goshujin deshita. ella NOM abrazar-PAS hombre TOP su_esposo ser-CORTÉS-PAS "El hombre que ella abrazó es su esposo."

Hay algunas tendencias generales que correlacionan el orden de los elementos sintácticos a nivel de la oración con el orden dentro de las frases. Orden oraciones Orden frases Adposiciones SOV postposiciones núcleo final VSO preposiciones núcleo inicial SVO cualquiera de los dos cualquiera de las dos Estas son sólo tendencias y tienen muchas excepciones. Mientras que los lenguajes SOV son casi siempre de núcleo final y postposicionales (el ejemplo prototípico es  el japonés), el latín es SOV y sin embargo usa preposiciones y posiciona bastante libremente los modificadores con respecto a sus núcleos. Los lenguajes SVO son  indiferentes (el inglés y el chino son ambos preposicionales, pero el chino tiende más marcadamente a ser de núcleo final que el inglés; y el español, el francés y el  italiano, todos ellos SVO, son de núcleo inicial). Los lenguajes SOV usualmente marcan el sujeto de alguna forma explícita, para que no se confunda con el objeto que  sigue; los lenguajes SVO no necesitan esa clase de marca, aunque muchos la usan, porque el verbo mismo separa y distingue el sujeto del objeto.

Lenguajes V2
Algunos lenguajes (con diferentes órdenes de palabras) muestran una peculiaridad en la posición del verbo dentro de la oración. Se los llama lenguajes V2 (abreviado del inglés verb-second languages, o lenguajes con verbo segundo). Todos los lenguajes germánicos (excepto el inglés) son V2. El verbo tiene que ser siempre el  segundo constituyente de la oración. Esto no es lo mismo que tener orden SVO u OVS; el español es casi siempre SVO, pero en una oración como 'Ayer en mi casa  hubo una fiesta', el verbo es el tercer constituyente (el primero es el adverbio 'ayer', y el segundo es el complemento 'en mi casa'). Para nuestros propósitos, los  constituyentes son las frases nominales (el artículo o demostrativo + sustantivo + adjetivos), las frases verbales (verbos conjugados y auxiliares), adverbios y frases  adverbiales (complementos de lugar, tiempo, etc.). En los lenguajes V2, hay espacio para un y sólo un constituyente antes del verbo. Si algo tiene que ser enfatizado, usualmente se mueve al principio de la oración (esto  ocurre en muchos lenguajes). Si el lenguaje es V2, sin embargo, esto significa que lo que estaba al principio va a tener que desplazarse hacia atrás, después del verbo.  Por ejemplo, en alemán se puede decir (con el auxiliar verbal en MAYÚSCULAS):
Zum Geburtstag HAT sie ihm ein Buch geschenkt. Por su cumpleaños ella le ha regalado un libro. (lit. 'Para su cumpleaños ha ella a él un libro regalado.') Ein Buch HAT sie ihm zum Geburtstag geschenkt. Ella le ha regalado un libro por su cumpleaños. (lit. 'Un libro ha ella a él por su cumpleaños regalado.') Geschenkt HAT sie ihm zum Geburtstag ein Buch. Ella le ha regalado un libro por su cumpleaños. (lit. 'Regalado ha ella a él por su cumpleaños un libro.')

Por supuesto, el alemán tiene casos gramaticales, así que el sujeto y los objetos no se confunden tanto como en la traducción literal española.

Sistemas de gatillo
Este tema queda un poco fuera del propósito de esta sección, pero sentí que valía la pena incluirlo. La clasificación de órdenes de la que he estado hablando asume  que habrá un sujeto, un verbo y un objeto, que serán diferenciables por el orden de las palabras en sí, o por inflexiones de caso. Hay un sistema diferente, que se usa en la mayoría de los lenguajes de Filipinas, como el tagalog, en el cual el sujeto, el objeto y otros modificadores pueden aparecer  en órdenes distintos y no están marcados de forma tradicional. Se llama sistema de gatillo. El gatillo es la parte de la oración sobre la cual se pone énfasis (creo que es correcto llamarla el tópico). El gatillo puede ser el sujeto de la oración de acuerdo a  nuestra visión, pero también el objeto, o una localización, o el verbo o predicado mismo. El gatillo está marcado como tal (por una partícula, por inflexión o por orden  de palabras), pero esto sólo indica que es el gatillo, no su función. Otras partes de la oración se marcan de forma distinta. Luego, el verbo se marca para mostrar la  relación entre la acción y el gatillo. Es decir, el 'caso' del gatillo no se marca en él, sino en el verbo. Para ilustrar esto, voy a transcribir parte de un mensaje de Kristian Jensen a la lista Conlang, enviado amablemente por él cuando pregunté de qué se trataba el tema.  Traduzco: En tagalog, hay sólo tres marcas de caso: el gatillo, el genitivo, y el oblicuo. Esto es exactamente como la mayoría de (si no todos) los lenguajes filipinos.  Más aún, como ocurre en muchos lenguajes austronésicos occidentales, hay un gran inventario de afijos usados para crear diferentes matices en los  verbos, notablemente el gatillo verbal. Cuando el gatillo cumple el rol de agente, un afijo de gatillo-agente se usa en el verbo. Cuando el gatillo cumple el rol de paciente, un afijo de gatillo-paciente se usa con el verbo. Cuando el gatillo cumple el rol de una locación, entonces se usa un afijo de gatillolocación en el verbo. Etc. etc.... Una característica particularmente digna de mención en este sistema es que los argumentos básicos no-gatillo (no enfocados) se marcan como genitivos. Como resultado, "Estoy comprando" y "Mi compra (de algo)" tienen estructuras idénticas. Las construcciones verbales parecen ser idénticas a las  nominales, por medio del uso de genitivos. Una teoría dice que los afijos verbales de gatillo son realmente afijos nominalizantes. Los ejemplos siempre  ayudan. Tomemos la oración "El hombre cortó madera en el bosque". Con tres argumentos distintos, son posibles tres formas del gatillo. Aquí abajo hay  ejemplos desglosados de la forma en que un lenguaje filipino traduciría la oración. He decidido no usar ejemplos de un lenguaje real en este punto  esperando que sea más fácil de entender cómo funciona el _sistema gramatical_ (_no_ el morfológico).
Gatillo AGENTE: AGT-cortar GEN-madera OBL-bosque GAT-hombre [agente-de-cortar] [de madera] [en bosque] = [hombre] lit.: "El cortador de madera en el bosque es el hombre" trad.: "El hombre, él cortó madera en el bosque" Gatillo PACIENTE: PAC-cortar GEN-hombre OBL-bosque GAT-madera [paciente-de-cortar] [de hombre] [en bosque] = [madera]

lit.: "El paciente de corte del hombre en el bosque es la madera" trad.: "La madera, el hombre la cortó en el bosque" Gatillo LOCACIÓN: LOC-cortar GEN-hombre GEN-madera GAT-bosque  [locación-de-cortar] [de hombre] [de madera] = [bosque] lit.: "La locación de corte de madera del hombre es el bosque" trad.: "El bosque, el hombre cortó madera allí"

Noten cómo he nominalizado los verbos en la transcripción. Así, el verbo para cortar ha sido nominalizado como un agente, un paciente, o una locación,  dependiendo del rol del gatillo. Hay otras formas verbales de gatillo, incluyendo benefactor e instrumento. Mi propia teoría es que los lenguajes de gatillo  tienen sólo un argumento básico. Siendo éste el caso, recurren a nominalizar los verbos. Esto puede explicar también por qué no existen construcciones  pasivas en los lenguajes de gatillo, ya que valencia de los verbos no cambia (no puede cambiar) con gatillos diferentes. En un lenguaje que usa un sistema de gatillo, no es útil hablar de sujeto, objeto, etc., y el orden de palabras puede variar considerablemente. En tagalog, el predicado  (el verbo nominalizado) es la primera palabra de la oración, y el gatillo es la última. Otros lenguajes pueden ser distintos. También es igualmente inútil hablar de verbos  transitivos o intransitivos, o de voz (activa, pasiva o media). Esto es sólo para mostrarte cómo las cosas pueden ser realmente diferentes, y aun así entendibles. ¡A ver si podés imaginarte algo más!

Tipología morfosintáctica
Cuando uno habla de argumentos verbales (o elementos sintácticos que están en relación con el verbo), se pueden distinguir dos básicos, que llamamos sujeto y  objeto. Según la forma en que se marcan (con sintaxis y/o con morfología) el sujeto y el objeto, tenemos varias clases de lenguajes: 1. Un lenguaje acusativo es uno en que
l l

el sujeto de todos los verbos (transitivos e intransitivos) se marca con un mismo caso gramatical, que convencionalmente se denomina "nominativo"; el objeto de un verbo transitivo se marca con otro caso, que convencionalmente se llama "acusativo".

2. Un lenguaje ergativo es uno en que
l l

el sujeto de un verbo intransitivo y el objeto de un verbo transitivo se marcan ambos con el mismo caso gramatical, que se denomina "absolutivo"; el sujeto de un verbo transitivo se marca con otro caso, que por convención se llama "ergativo". 

3. Un lenguaje activo es uno en que
l l l

el sujeto de un verbo transitivo se marca con un caso gramatical, que se llama generalmente "agentivo" (A); el objeto de un verbo transitivo se marca con otro caso, que se denomina "pacientivo" (P); el sujeto de un verbo intransitivo se marca con uno de los dos casos mencionados (agentivo o pacientivo) según consideraciones semánticas. 

Una forma diferente y más formal de entender este tema es usar tres categorías sintácticas, que convencionalmente se llaman S, A y P, donde S es el único argumento  de un verbo intransitivo, y A y P son los dos argumentos de un verbo transitivo. No hay (según parece) ningún lenguaje en la Tierra que marque estos tres roles usando tres casos gramaticales diferentes; generalmente están divididos, dos por un  lado (con un caso dado) y uno por el otro (con otro caso distinto). Un lenguaje que agrupa (trata igualmente) los argumentos S y A es un lenguaje acusativo (P va en acusativo); un lenguaje que agrupa S y P es un lenguaje ergativo (A va en caso ergativo); y un lenguaje que agrupa S y A o S y P según el verbo es un lenguaje activo. Aparentemente no hay lenguajes que agrupen los tres roles; algo (morfología, orden de las frases) distingue entre ellos en la mayoría de las ocasiones (y si no, el  contexto resuelve las ambigüedades). Además, casi ningún lenguaje agrupa A y P y aparta S, ya que A y P necesitan ser diferenciados de alguna forma porque  aparecen los dos juntos con el verbo es transitivo, mientras que S no necesita marcas especiales porque el verbo es intransitivo y no tiene otros argumentos.
_ / \ / S \ / / / / \ A / P \_/ ^ ^ | | | NOM ACU _ / \ / S \ \ \ \ \ A \ P / \_/ ^ | ^ | | ERG ABS

Lenguajes acusativos
Recordemos la definición dada arriba: los lenguajes acusativos marcan el sujeto de todos los verbos con un mismo caso (nominativo, NOM) y el objeto de los verbos transitivos con otro caso (acusativo, ACU). Por eso también se llaman nominativo-acusativos. El ejemplo clásico de lenguajes de este tipo es el latín.
domin-us veni -t señor-NOM venir-3sPRS "El señor viene." domin- us serv -um audi -t señor-NOM esclavo-ACU escuchar-3sPRS "El señor escucha al esclavo."

En la mayoría de los lenguajes romances no se han preservado las marcas morfológicas de caso del latín, pero el orden de las palabras dentro de la oración, al igual 

que la concordancia y el contexto, permiten diferenciar el rol nominativo y el acusativo, con lo cual dichas lenguas presentan acusatividad sintáctica antes que  morfológica. Ésta puede confirmarse observando frases donde un argumento es elidido (omitido) y queda expresado en forma tácita. En la frase "el alumno vio a la maestra y se fue"  hay dos proposiciones coordinadas con un argumento en común. El hecho de que el argumento faltante sea "el alumno" apunta a que éste es un lenguaje  acusativo, porque el argumento que está en caso nominativo tomó precedencia para ocupar el lugar vacante, ya que el verbo de la segunda preposición ("se fue") requiere un sujeto nominativo. En un lenguaje ergativo (ver abajo) el lugar faltante hubiera sido ocupado por el argumento en caso absolutivo (que es el objeto de la primera proposición). La inmensa mayoría de los lenguajes indoeuropeos son acusativos. Sin embargo, algunos presentan comportamiento ergativo parcial.

Lenguajes ergativos
Un lenguaje ergativo, como ya vimos, es uno que marca los sujetos de los verbos transitivos con un caso (ergativo, ERG), y los sujetos de los verbos intransitivos y los objetos de los transitivos con otro caso (absolutivo, ABS). El lenguaje ergativo más conocido en Europa es el euskara (vasco); de hecho es el único lenguaje ergativo europeo, y no puede ser agrupado en ninguna familia  lingüística, representando probablemente el último resto de ergatividad que quedó atrás luego de la ocupación indoeuropea. El georgiano (hablado en la nación de Georgia, ex-república soviética y lugar de nacimiento de Stalin) presenta patrones ergativos en una de las series de  conjugaciones verbales (sistema extremadamente complicado), pero es acusativo en el resto. En una gramática de la que dispongo se lo describe como de ergatividad  formal, pero con características de lenguaje activo de tipo Split-S (ver abajo). El lenguaje australiano dyirbal es también ergativo en parte (utiliza una estructura ergativa para las oraciones en tercera persona, pero es acusativo cuando se usan los  pronombres de primera y segunda persona), con una estructura sintáctica subyacente ergativa. El hindi es ergativo en los tiempos verbales perfectos y acusativo en los  imperfectos. (Estos casos extraños han sido explicados de varias maneras, todas ellas muy densas...) Un ejemplo de ergatividad (en euskara):
umea erori da ume -a -0 eror-i da niño-el-ABS caer-PRF AUX:PRS+3sS el niño (ABS) caído está "El niño se cayó." emakumeak gizona ikusi du emakume-a -k gizon -a -0 ikus-i du mujer -la-ERG hombre-el-ABS ver -PRF AUX:PRS+3sS+3sO la mujer (ERG) al hombre (ABS) visto ha "La mujer ha visto al hombre."

En un lenguaje ergativo, el argumento en caso absolutivo es el que se asume cuando falta. Así, mientras que en español "el alumno vio a la maestra y se fue" se interpreta que "el alumno vio a la maestra" + "el alumno se fue", el equivalente en euskara u otro lenguaje ergativo (con ergatividad sintáctica) se interpretaría  incorporando el objeto absolutivo de la primera proposición como sujeto del segundo verbo (que es intransitivo):
"el alumno (ERG) vio a la maestra (ABS) y se fue" se interpreta como "el alumno (ERG) vio a la maestra (ABS)" + "[la maestra (ABS)] se fue"

Una prueba de este tipo con los hablantes nativos de un lenguaje (donde se les fuerce a llenar los espacios vacantes y completar su interpretación) es una forma de  determinar si un lenguaje es ergativo/absolutivo. Como rasgo interesante, los lenguajes ergativos no suelen presentar voz pasiva, pero sí una voz antipasiva, la cual elimina el objeto directo y degrada el sujeto de  ergativo a absolutivo (transforma el verbo en intransitivo).

Lenguajes activos
Recordemos que un lenguaje activo es uno donde el Sujeto de un verbo intransitivo puede marcarse de dos formas (A o P) según consideraciones semánticas del  verbo o de su argumento. Los lenguajes activos se subdividen a su vez en dos tipos:
l

l

a. Lenguajes con Sujeto Dividido ("Split-S"), en los que la decisión de marcar el sujeto de un determinado verbo como agentivo o como pacientivo está por así  decirlo tomada de antemano de forma convencional, y fijada como parte de la estructura sintáctica;  b. Lenguajes con Sujeto Fluido ("Fluid-S"), en los que la decisión de marcar un sujeto como agentivo o pacientivo depende de consideraciones semánticas  actuales y debe ser tomada por el hablante según su intención y contexto, pudiendo variar el significado de la expresión. 

Las consideraciones semánticas mencionadas pueden tener que ver con la clase de concepto descripta por el verbo (¿es un evento o acción, o es un estado o  circunstancia?), así como con el grado de control o voluntad del sujeto sobre la acción o estado expresado por el verbo (¿es una acción voluntaria o involuntaria? ¿la  realiza el actor directamente o a través de un instrumento u otro medio indirecto?). En los lenguajes Fluid-S estas consideraciones deben ser meditadas por el hablante para inclinar el significado hacia un lado u otro. En los lenguajes Split-S cada verbo tiene asignada estas connotaciones (y por lo tanto la forma en que debe marcar su sujeto) como parte de su definición, y por lo tanto el hablante sólo puede aprender la forma usual y emplearla, modificándola por otros medios cuando le parezca  necesario cambiar el significado más común. Por ejemplo, 'dormir' es un estado no voluntario. En un lenguaje Split-S, el hablante marcará el sujeto de 'dormir' como pacientivo siempre. Si desea explicitar que se  realizó un esfuerzo para conciliar el sueño, o algo similar, deberá recurrir a auxiliares ('tratar de dormir') u otros medios para transmitir este significado. En cambio, en  un lenguaje Fluid-S, si bien típicamente se usará 'dormir' con un sujeto en pacientivo, quizá el hablante podría sugerir un 'irse a dormir con esfuerzo' utilizando el mismo  verbo 'dormir' con sujeto agentivo. De la misma manera se podrían dar significados distintos al verbo 'toser' (generalmente involuntario pero a veces provocado por el 

mismo actor) o 'darse vuelta' (activo y casi siempre voluntario, pero a veces un acto reflejo inconsciente). Daniel Andreasson, de la lista CONLANG, investigó el tema por su cuenta y envió a la lista un resumen. Afirma que los lenguajes activos distinguen los sujetos A y P  según varios criterios (cada lenguaje utiliza primariamente uno de éstos):
l l l

a) evento vs. estado b) control c) actuación, efecto e instigación 

"Evento vs. estado" significa que si el verbo expresa un evento ('correr', 'bailar', 'hablar', 'matar'), entonces el sujeto se marcado con A. Si es un estado ('tener hambre', 'estar cansado', 'dormir'), entonces se marca con P. "Control" significa que si el argumento del verbo controla el evento (o estado), entonces es marcado con A; y si no tiene dicho control, entonces es marcado con P. 'Irse' y 'tener cuidado' son predicados controlados; 'morir' y 'caer' no lo son. "Actuación, efecto e instigación" se refiere a que algunos predicados son de alguna manera actuados (realizados) o instigados por el actor, aun cuando no estén  controlados por él, como ocurre en el caso de verbos como 'estornudar' y 'vomitar'. En lenguajes como el lakhota o el georgiano, es suficiente si el actor de cualquier  forma efectúa la acción (o el estado), aunque no lo controle, para que el sujeto sea marcado como A. En un lenguaje del tipo (c), 'estornudar' y 'tener hipo' marcan su  argumento como A, al contrario que los del tipo (b), donde por no tener control el actor se marcan como P.

Analogía
Analogía es el término general que designa varios tipos de procesos que cambian la forma fonética y la gramática de una palabra o de una expresión, y que se produce  por ciertas causas que detallaré. Cuando hable de analogía aquí, me referiré normalmente a un cambio fonético. La analogía es la creación de una nueva forma (de una palabra) por influencia de otras formas similares, análogas. Es un medio gramatical muy fructífero, y  probablemente uno de los que más crean palabras en todos los lenguajes. Veamos un ejemplo. El latín deriva del protoindoeuropeo (un lenguaje o conjunto de dialectos de un lenguaje que ha sido reconstruido basándose en sus lenguas hijas). En PIE, los  sustantivos tenían caso gramatical. La palabra para 'honor' se reconstruyó con una raíz *honos, que en un cierto caso era *honosem. Ahora bien, a medida que el PIE se transformaba en latín (y también en griego, germánico, sánscrito, etc.), se produjeron algunos cambios de sonidos. En particular,  la /s/ intervocálica se hizo gradualmente sonora (/z/), y finalmente produjo un sonido trillado alveolar, /r/ (como la rr española). Este cambio es bastante común (se  llama rotacismo). Sucedió solamente cuando la /s/ era intervocálica, no en otra posición.
(Antes)       (Después) *honos *honosem -> -> honos honorem

Esto, como se ve, produjo una irregularidad; la forma radical de la palabra se dividió en dos formas, honos- y honor-. Todos los lenguajes tienen formas irregulares, pero ésta (y muchas otras de la misma clase) probablemente no fue aceptado por los hablantes. Ahora vamos a poner una mano sobre la columna 'Antes' para taparla,  ignorarla. Los hablantes de latín no sabían nada de cambio de sonidos, que es un proceso sutil e inconsciente (y no estudiado en esa época). ¿Qué hacer con el par  irregular, honos/honorem? La solución vino de la mano de una analogía con las muchas palabras que no habían cambiado su forma, conservando la misma raíz (o cambiándola consistentemente).  Tenían honorem y también tenían honoris, quizá incluso palabras como honorificum y así, de manera que comenzaron a decir honor en vez de honos. Por analogía,  una forma se asimiló a las otras. Por supuesto, ningún lenguaje lleva la analogía tan lejos como para regularizar toda su gramática. Una forma relacionada de analogía aparece cuando la gente crea palabras a partir de elementos que tenían, basadas palabras similares. Por ejemplo, teniendo fin finalizar  y otras similares, en español han aparecido idealizar, nacionalizar, hospitalizar y muchísimas más. Si estás creando un lenguaje, la analogía probablemente  sea la mejor herramienta posible para incrementar tu léxico.

Otros medios gramaticales
Ésta es una sección general en la que menciono y hago un sumario de los medios gramaticales más comunes que se encuentran en los lenguajes del mundo, es decir,  cómo la gramática se maneja a nivel práctico, en palabras reales. Ya hemos visto la mayoría de estos medios de una forma u otra. Aquí hay una breve lista de ellos:
l

l

l

l

Afijación: añadir prefijos, sufijos o infijos a las palabras, para cambiar su significado o su relación con otras palabras. Estos afijos incluyen lo que llamamos  inflexiones y aglutinación.  Orden de palabras: es libre en algunos lenguajes, y fijo en otros. En general, cuanto más sintético es un lenguaje, más libre es el orden. Un lenguaje analítico  depende más del orden de las palabras para clarificar su significado y relaciones, ya que estas palabras no toman inflexiones y por lo tanto no muestran su  función en su estructura. Un lenguaje sintético puede construir una oración con palabras desparramadas o desordenadas (de hecho esto se llama hipérbaton y es un tipo de licencia poética).  Acento y altura: los hemos visto. En algunos lenguajes son solamente formales; en muchos otros, dos palabras pueden tener diferentes significados si difieren sólo en sus patrones de acentuación. Por ejemplo, en español camino (verbo o sustantivo) vs. caminó, o en inglés record /'rEk@rd/ 'disco, grabación' vs.  record /rI'kord/ 'grabar, registrar' (el inglés tiene muchos pares de palabras bisilábicas como éstas, que alternan entre verbo y sustantivo según cambie el  acento). Tono: lo mismo que para el acento y la altura. A veces un cambio en el tono distingue dos palabras, y a veces produce una forma diferente del mismo concepto raíz. En shilluk, yít (tono alto) significa 'oreja', y yìt  (tono bajo) significa 'orejas'; el tono no es sólo fonético sino gramatical. En chino, por otro lado, el tono es  casi siempre sólo fonético y fonémico, pero no tiene función gramatical. 

l

l

Alternancia: la hemos visto con ejemplos. Es el cambio (regular) de sonidos en las palabras. La más común es la alternancia vocálica, que se encuentra mucho  en los lenguajes germánicos, particularmente en el inglés: obsérvense las formas verbales sing/sang/sung 'cantar/cantó/cantado', y los plurales irregular  man/men 'hombre/hombres', goose/geese 'ganso/gansos'. En algunos lenguajes esto no es irregular sino la norma. La alternancia consonántica es menos común  pero existe. Las consonantes pueden alternar en formas diferentes: por voz (sonora/sorda), por modo de articulación (cambiando de oclusiva a fricativa, o a  africada, o de simple a doble [geminada]), o de formas más extrañas. Hay un lenguaje africano donde /t/ alterna con /l/, y /p/ alterna con /w/ (esto es alternancia de voz y de modo de articulación).  Reduplicación: (una parte de) una palabra es duplicada, repetida antes o después de ella. Un verbo reduplicado puede hacerse continuo o incrementar su  fuerza, como en el hotentote, go 'mirar' vs. go-go 'examinar con atención' (usado por Philip J. Farmer en Jinetes del salario púrpura, en su "Escuela de Crítica  Go-go"). Un sustantivo reduplicado puede ser tomado como plural, como gyat 'persona' vs. gyigyat 'personas' (de vuelta un lenguaje africano), que también  muestra alternancia vocálica. A veces la reduplicación no tiene función en sí sino que forma parte de una inflexión. En griego, las formas perfectas de los verbos  usan reduplicación y alternancia: līp ō 'me voy', hélipon 'me fui', léloipa 'me he ido'.

Creando palabras
Bien, ahora que todo está dispuesto, hay que empezar a crear palabras. Probablemente ya tengas algunas partículas, terminaciones de caso, afijos, etc., pero eso es  solamente el esqueleto. ¿Cuántas palabras necesitás? Si estás creando un lenguaje completo (asumo que así es, porque no habrías llegado hasta aquí si no), vas a necesitar cerca de dos mil  palabras para comunicarte con cierta comodidad. Se puede hacer bastante con unas mil palabras, si eso te asusta; pero probablemente vayas a ir creando nuevas palabras de cuando en cuando. Mark Rosenfelder menciona la tesis de Ogden y Richards. Esta gente demostró que la mayor parte de un texto común en inglés (pero esto vale para cualquier  lenguaje) contiene un léxico muy reducido. Un cierto grupo de palabras comunes cubre el 80 o 90% de todo el texto. Entonces dijeron, "Bueno, entonces aislemos  estas palabras y usémoslas a ellas y sólo a ellas, combinándolas para formar los conceptos más complicados en vez de usar palabras menos comunes". Por ejemplo,  olvidar la palabra succeed 'tener éxito' y usar la expresión make good 'irle bien a uno'. En total uno podría arreglarse con 850 palabras comunes, más unas cien extra  para campos específicos. El argumento es correcto, pero tiene un falla. Las palabras más comunes que cubren tanto del texto son también las que llevan menos información: artículos,  preposiciones, pronombres, etc. En los titulares de los diarios, éstos son usualmente omitidos, porque no son tan importantes, y el resto se puede entender. Las  palabras no tan comunes no se pueden omitir, porque son las que transportan todo el significado, toda la información. De hecho, la base teórica de la informática  moderna dice que los signos más raros son los que poseen la mayor información. Si entendés el 90% de las palabras de un texto, pero el 10% restante se compone de  la información más crítica, realmente no estás obteniendo nada excepto un montón de partículas que conectan conceptos ininteligibles. Por lo tanto, no ahorres palabras. Nunca pueden ser demasiadas. ¿Cómo empezar? No hay método, pero puedo contarte algunas maneras que he usado:
l

l

l

l

Podés traducir textos simples. Cuando necesites una palabra, la creás; si hay una raíz relacionada disponible, la derivás de ahí, o de lo contrario creás y anotás  una raíz nueva primero. No se puede hacer salir palabras de ninguna parte. La traducción es tediosa, y es molesto parar a cada palabra e inventarla, pero es  muy buena para crear palabras. Qué traducir es tu decisión. Desde luego, no recomiendo comenzar con Borges o Cortázar... El texto de Babel (Génesis 11, 19) es bastante bueno (y un clásico entre la comunidad internacional de creadores de lenguajes, por razones obvias). Podés continuar con la Biblia (o el Talmud o  el Rgveda o cualquier otro libro sagrado de tu religión, si tenés una y si tiene libros sagrados). Si parece demasiado denso, probá con comics o con El Hobbit. Si te animás, probá traducir de otro lenguaje construido. Quizá puedas encontrar una lista de vocabulario básico. Por ejemplo, yo tengo un diccionario inglés-inglés pensado para alumnos no nativos, con una lista de  dos mil palabras comunes que se usan para explicar las definiciones, y he tomado algunas palabras de allí y las he traducido a mi propio lenguaje. No traduzcas diccionarios. Es aburrido, consume tiempo, y no tiene sentido; vas a terminar teniendo muchas palabras raras, con traducciones españolas comenzadas todas  por a. Encontrá un tema o campo semántico e inventá palabras pertenecientes a él. Por ejemplo, verbos de movimiento (caminar, ir, saltar, venir, levantarse, arrastrar,  girar), o partes del cuerpo (cabeza, brazos, piernas, dedos, cara, ojos, pelo), o colores (ya conocés los colores), o números (vas a tener que crear un sistema  numérico o usar el decimal), o herramientas, o animales, o electrodomésticos.  Ésta todavía no la he usado, pero parece interesante: crear palabras que riman. Tomá cualquier conjunto de conceptos en español, y traducí el primero con una  cierta palabra en tu lenguaje, y todas las otras con palabras que rimen con ésa. O al revés. O podés probar con series alternantes, palabras que varían sólo su  primera consonante, o sus vocales (por supuesto, deberían ser conceptos sin relación, a menos que la alternancia de sonidos sea un dispositivo de inflexión  válido). Después podés usar la lista para hacer juegos de palabras. :-)

Hay una lista de palabras muy interesante (Universal Language Dictionary) que abarca 1600 palabras divididas por temas, y usadas de alguna forma por los lenguajes más comunes del mundo. La podés encontrar en el sitio de Model Languages: viene con el generador de lenguajes Langmaker. Muy bueno, por lo menos para buscar palabras (no es muy divertido sentarse y generarlas una después de otra). Para una forma simple pero útil de generar palabras, probá Wordgen. Te permite especificar las consonantes y combinaciones iniciales, medias y finales, las vocales y diptongos, y el número de sílabas que querés.

Palabras finales
Si querés ser un gran creador de lenguajes, ¡leé! Leé cualquier cosa que te caiga en las manos o que pase cerca. La Web está llena de material, aunque un poco  desparramado. Ya he mencionado algunas de mis fuentes. Aquí hay una lista completa de sitios que deberías visitar (todos en inglés, desafortunadamente; de ahí que  yo haya hecho esta traducción): Model Languages es una newsletter dedicada a la creación de lenguaje, que solía publicarse cada dos meses. Ahora ya no se publica, pero las entregas antiguas  todavía están en el sitio. Hay mucho material allí, bastante para leer, y también tiene una lista de más de 200 links a páginas de lenguajes construidos. Hay también un  generador de palabras que maneja diferentes estructuras silábicas y produce palabras a partir de ellas, y puede derivarlas por cambios de sonidos sencillos. Mark Rosenfelder ha hecho un gran trabajo en su sitio, Metaverse, incluyendo el Language Construction Kit, una introducción al quechua, una lista de números del 1 al  10 en más de tres mil lenguajes, y mucho material sobre uno de sus lenguajes, el verdurian. También está la Human Languages Page, que está un poco mezclada, pero te ayuda a encontrar recursos de lingüística sobre muchos lenguajes naturales.

Si sos un fan de J. R. R. Tolkien, podés encontrar inmensas descripciones de los lenguajes que él inventó en Ardalambion (Lenguas de Arda). Para ver algunas escrituras del mundo, tenés Ancient Scripts, un conjunto de páginas muy bien armadas con ejemplos de sistemas de escritura de todo el mundo,  incluyendo Mesoamérica, Europa y el Oriente Medio.  Si hablás inglés y querés entrar en la comunidad de lenguajes construidos, uníte a la lista de e-mail Conlang escribiendo a listserv@listserv.brown.edu con subscribe conlang tu_nombre en el cuerpo del mensaje. Conlang está dedicada a la discusión de lenguajes construidos para propósitos de ficción (no lenguajes auxiliares). Joshua Shinavier, un miembro compañero de Conlang, tiene una lista bastante completa de lenguajes construidos de los cuales se puede encontrar material en Internet: The Conlang Yellow Pages. No hay mejor forma de aprender que ver cómo otros lo hacen. Y después, por supuesto, están las bibliotecas, esos edificios silenciosos llenos de libros. He aprendido mucho de los libros de lingüística. Casi siempre son densos y a  veces ininteligibles (no fueron hechos para gente común que trata de crear lenguajes), pero frecuentemente explican temas curiosos junto con ejemplos. Para inventar  un buen lenguaje hay que estudiar lenguajes naturales. ¡Y bien, hasta pronto! Si estás creando un lenguaje y te gustaría exponerlo al aplauso o la crítica del mundo, o tenés que pedir consejo o dar consejo, escribíme y voy a hacer lo que pueda para corresponder a tus expectativas.

Agradecimientos
Deseo dar gracias a los siguientes:
l

l l

l l

l l l l l

l l

Mark Rosenfelder, por su excelente trabajo en el "Kit de Construcción de Lenguajes", que me enseñó mucho y me inspiró a escribir esto, y por no quejarse  cuando me apropié de grandes trozos del mismo.  Jeffrey Henning, por su (también impresionante) trabajo como editor de la famosa revista online "Model Languages".  Nik Taylor, compañero miembro de CONLANG, que si mal no recuerdo fue la primera persona que me escribió en referencia a estas páginas, corrigiendo  algunos graves errores y contribuyendo con datos sobre el récord de 92 consonants del !Xu~ y la proporción promedio de obstruentes a sonorantes.  Kristian Jensen, quien me enseñó a mí y al resto de la lista CONLANG sobre los sistemas de gatillo.  Markus Miekk-oja, alias Miekko, quien compartió conmigo muchas cosas curiosas sobre lenguajes reales y ficticios, incluyendo los misterios de los muchos  casos gramaticales del finés, y los nombres y usos de los modos verbales del nenets.  Jarkko Hietaniemi, por un bonito ejemplo de aglutinación en finés.  Donald Patrick Michael Goodman III, por enseñarme a decir "Él es guapo" en japonés y luego poner el adjetivo en tiempo pasado.  Reena D., por corregir un error tipográfico en el ejemplo dado por Donald.  Mathias Lasailly, compañero de CONLANG, quien suministró el ejemplo de posesión demostrada por una cláusula subordinada con el verbo "tener" en ainu.  Cseri Benedek, quien corrigió mi error de haber afirmado que ningún lenguaje marca consistentemente la transitividad en los verbos, mostrándose cómo se  hace precisamente esto en húngaro.  Todos los miembros de la lista CONLANG que no he nombrado arriba. John Ronald Reuel Tolkien, Jorge Luis Borges, y tantos otros que me han hecho pensar sobre las palabras, su significado, su belleza y su magia, que hace tangible la sustancia de los pensamientos y de los sueños.