You are on page 1of 12

DIVERSIDAD Y EDAD DE LOS CUATRO HAPLOGRUPOS DE ADNmt MS IMPORTANTES, Y SUS IMPLICANCIAS EN EL POBLAMIENTO DEL NUEVO MUNDO.

Sandro L. Bonatto y Francisco M. Salzano


Departamento de Gentica, Universidade Federal do Rio Grande do Sul, Porto Alegre, Brazil.

Traduccin: Paola Mazza SUMARIO A pesar de la considerable investigacin, dos preguntas principales sobre le origen de los nativo americanos permanece como tema de un intenso debate, principalmente el nmero y fecha de la migracin(es) en las Amricas. Usando el ADNmt amerindio disponible de las secuencias de control regionales, hemos re-analizado la diversidad nucletida encontrada en cada uno de los cuatro haplogrupos de ADNmt ms importantes (A-D) pensados como hallables en la colonizacin del Nuevo Mundo. Primero verificamos si la diversidad secuencial dentro del haplogrupo podra ser usada como una medida de la edad del haplogrupo. El patrn de polimorfismo compartido, la distribucin desigual, los rboles filogenticos, el valor del D Tajima, y las simulaciones por computadora, sugirieron que los cuatro haplogrupos pasaron por un cuello de botella, seguido por una gran expansin poblacional. Las cuatro diversidades de haplogrupos eran muy similares entre s, ofreciendo un fuerte apoyo al origen nico. Ellos sugirieron que el comienzo de la diferenciacin de la poblacin ancestral de los nativos americanos ocurri hace unos 30.000-40.000AP, con un intervalo confiable lmite de un 95%, o unos 25.000 AP. Estos valores estn en correlacin con el modelo de la colonizacin del nuevo mundo que hemos presentado en otro lado, extendiendo los resultados inicialmente encontrados para el haplogrupo A a los otros tres grupos ms importantes, de secuencias de ADNmt encontradas en las Amricas. Estos resultados ponen la poblacin de las Amricas claramente en un lapso de tiempo ms temprano de la era pre-Clovis. INTRODUCCIN La pregunta acerca del origen de los indgenas americanos ha sido objeto de gran debate. Algunos problemas importantes han sido lentamente resueltos desde el siglo pasado. El principal acuerdo alcanzado hasta el momento, concerniente al origen de esta gente es por una migracin desde Asia a travs del Estrecho de Bering hace ms o menos unos 12.000AP (Cavalli-Sforza et al. 1994). De todos modos, la fecha y nmero de esas migraciones, como as tambin el tamao de las poblaciones ancestrales, todava son importantes preguntas vagas. Estudios previos, basados en altas resoluciones del RFLP y las secuencias de regin de control (CR) han mostrado que la gran mayora del ADNmt de los nativos americanos que se estudi hasta el momento podan ser clasificados en cuatro grupos distintivos, llamados haplogrupos A-D. La distribucin de estos cuatro haplogrupos que hablaban los tres tipos principales de lenguas encontradas en las amricas (amerindio, Na-Dene y Eskimo-aleutiano), como as tambin los estimados de la diversidad interna de cada haplogrupo, ha llevado a varias hiptesis, relacionadas al nmero y edad de las

migraciones que colonizaron el nuevo mundo. Aunque generalmente las poblaciones amerindias tienen los cuatro haplogrupos, los grupos Na-Dene y Eskimos tienen principalmente secuencias de haplogrupos A (Merriwether et al. 1995; Wallace 1995). Ms an, usando la data del RFLP, Torroni y otros encontraron una diversidad secuencial ms baja en el haplogrupo A en los Na-Dene que en los Amerindios, en donde, dentro de los Amerindios, el haplogrupo B tena una diversidad secuencial ms baja que en aquellos de los otros tres haplogrupos. Estos resultados llevaron a estos autores a sugerir que los Na-Dene entraron al continente en una migracin independiente (Wallace, 1995). Por otro lado, los amerindios, habran migrado a las amricas en dos oleadas; la ms antiguas trasportando los haplogrupos A, C y D, y la ms reciente transportando las secuencias del haplogrupo B. En la base dada a entender de la diversidad encontrada en los haplogrupos, Wallace y sus co-trabajadores fecharon la principal migracin amerindia en las amricas como ocurriendo en el 26.000-34.000 AP, la migracin del haplogrupo B ocurriendo hace 12.000-15.000 AP, y la Na-Dene ocurriendo en el 7.000-9.000 AP (Wallace, 1995). En contraste, Horai et al. (1993), usando la data secuencial CR, postul que cada haplogrupo principal representaran migraciones separadas, que ocurrieron entre el 14.000 y el 21.000 AP. Recientemente hemos mostrado (Boniato y Salzano, 1997), por otra parte, que la informacin de la secuencia del ADNmt, apoya fuertemente a un origen nico temprano (20.000 AP) para los amerindios, Na-Dene y Eskimo, en acuerdo con otros estudios moleculares (Merriwether et al. 1995; Foster et al. 1996; Colman et al. 1996). Nuestros resultados estuvieron principalmente basados en el anlisis de las secuencias del CR del haplogrupo A, siendo el nico haplogrupo ampliamente distribuido entre todos los nativos americanos (Merriwether et al. 1995). Permaneci desconocido si los otros tres haplogrupos principales de los nativos americanos indicaran el mismo paisaje. Tambin, aunque muchos estudios en el problema de la datacin de la colonizacin de las amricas han usado diversidad secuencial como medida de edad, pocos (e.g., Boniato y Salzano, 1997) han investigado si sus muestras llenaron las muy estrictas suposiciones requeridas por esta prctica (Rogers y Jorde, 1995). Los fines del presente estudio fueron para analizar la diversidad de los cuatro haplogrupos principales del ADNmt nativo americano y para evaluar las implicancias de estos resultados para la estimacin del nmero y edad de las migraciones en las amricas. Especficamente hemos testeado la hiptesis que uno o ms de los haplogrupos podra representar distintas migraciones al continente (e.g., Horai et al. 1993; Wallace 1995). Debera ser notado que aqu no testearemos la hiptesis de diferentes migraciones que est basada en los grupos lingsticos (amerindios, na-dene y eskimo), ya que esto ha sido hecho en todos lados (Boniato y Salzano, 1997). El anlisis involucr el uso de dos sets de datos, uno incluyendo a 720 nativos americanos, con su secuencia del segmento I hipervariable (HVS-I), y otro compuesto por 217 individuos, con su secuencias HVS-I +HVS-II. Varios mtodos fueron aplicados, incluyendo simulaciones por computadora sobre un amplio margen de escenarios demogrficos, para determinar si la data era consecuente con el cuello de botella, seguido por una gran expansin poblacional. Finalmente calculamos los valores de la diversidad nucletida dentro de los haplogrupos, y usando una apropiada proporcin y mtodos de sustitucin, estimamos su edad media y un 95% de valor de intervalo (CI) de confianza.

SUJETOS Y METODOS MUESTRAS POBLACIONALES Todas las secuencias de CR disponibles de los nativos americanos fueron usadas, con la excepcin de las dos poblaciones descritas por Horai et al. (1993), ya que no fueron secuenciadas para las primeras 100 bases de HVS-I. Tambin, solo algunas secuencias de los Yanomami de Easton et al (1996) fueron usadas, ya que muchas de ellas presentan varias caractersticas inusuales que evitan su utilizacin hasta que sean ms investigadas. Las otras secuencias tienen el set completo de nucletidos para el HVS-I (posiciones de la 16.024-16.383- siendo la numeracin de acuerdo a Anderson et al. 1981) o el HVS-I +HVS-II (posiciones 45-390 para el HVS-II), o solo una pequea fraccin de ellos est faltando. Dos sets de datos fueron ensamblados, uno con secuencias HVS-I y otro con secuencias HVS-I+HVS-II. Las secuencias fueron alineadas a mano, y las inserciones en relacin con la secuencia referencial (Anderson et al. 1981) no fueron consideradas. Para el HVS-I, la muestra nativa americana consiste en 720 individuos de un total de 24 poblaciones (con un tamao de muestra de n>5) de Norte, centro y sudamrica, para cada continente, como sigue: para sudamrica (n=318)_Xavante (n=25), Zor (n=30), y Gaviao (n=27) (Walrd et al. 1996); Wai Wai (n=26) y Suru (n=24); Mapuche (n=39), Kayapo (n=13), Arara (n=9), Katuena (n=9), Poturujara (n=9), Awa-Guaja (n=2), y Tiriyo (n=2) (Santos et al. 1996); Yanomami (n=50) (Easton et al. 1996); y momias colombianas (n=5) (Monsalve et al. 1996); para Amrica central (n=136)Huetar (n=27) (Santos et al. 1994); Ngob (n=46) (Colman et al. 1995); y Kuna (n=63) (Batista et al. 1995); y, para Norteamrica (n=228)Nuu-Chah-Nulth (n=63) (Ward et al. 1991); Bella Coola (n=40) y Haida (n=41) (Ward et al. 1993); y Yakima (n=42), Athapascan (n=21), Inupiaq Eskimo (n=5), y los Esquimales de Groenlandia del oeste (n=16) (Shields et al. 1993). Los 38 individuos que Torroni et al. (1993) haban secuenciado el ADNmt de todas partes de Amrica tambin fueron incluidos. Para el HVS-I + HVS-II, las secuencias estuvieron disponibles de un total de 217 individuos de los Huetar (Santos et al. 1994), Ngob (Colman et al. 1995), Mapuche (Ginther et al. 1993), y Yanomami (Easton et al. 1996) y de 24 Surur, 26 Wai Wai, 3 Xavante, 1 Gaviao, y 1 Zor. ANLISIS FILOGENTICO Varias distancias del ADN fueron usadas en tres construcciones, de la ms simple (proporcin de las diferencias) a la ms compleja (Tamura-Nei gamma, de Tamura y Nei 1993), pero todos dieron en esencia los mismos resultados; por lo tanto, solo aquellos con la distancia de los dos parmetros de Kimura (K2P, de Kimura 1980) fueron presentados. Por la gran cantidad de secuencias usadas, fueron construidos rboles con el mtodo de unin de vecinos (neighbor-joining, NJ), por el uso del programa Njboot (N. Takezaki; a disposicin en la direccin de Internet http://iubio.bio.indiana.edu). El valor del test de la rama interior de probabilidad confiable (CP) en las ramas de los rboles (Rzhetsky y Nei 1992) fueron estimados por el programa CheckSzDv (del TreePack package [I. Belyi; http://trantor.cse.psu.edu/ belyil]), por medio de la opcin de pairwise y la distancia de K2P. rboles de mnimo trayecto (Excoffier et al. 1992) tambin fueron

construidos, por medio del programa ftp://acasun1.unige.ch/pub/comp/win).

de

Minspnet

(L.

Excoffier;

ESTIMACIN DE DIVERCENCIA Y DIVERSIDAD La diversidad nucletida en y entre los haplogrupos fue calculada por medio del programa Sendbs (n. Takezaki; http://iubio.bio.indiana.edu). Varias distancias de ADN fueron calculadas, y los valores del error standard (SE) de estas estimaciones fueron obtenidos con un acercamiento por esfuerzo propio con 1.000 rplicas en los sitios. El 95% del intervalo de confianza (CI) para los valores de diversidad y divergencia fueron calculados usando el +/- 2 de error estndar (SE). El 95% del intervalo de confianza para el tiempo de origen (expansin) de los haplogrupos, basndose en el valor de la diversidad nucletida, fue estimada como lo describieron Boniato y Salzano (1997), usando su frmula 1 (modificada de Redd et al. 1995) para el clculo del error standard mnimo del tiempo (Tmse) y por el uso de +/- 2 Tmse para los valores lmites bajos y altos. Deberamos notar que nuestro 95% del intervalo de confianza considera ambas diversidad nucletida y el porcentaje de error de mutacin. Para la estimacin del tiempo, necesitamos los porcentajes de sustitucin para las regiones del HVS-I y el HVS-I + HVS-II, como as tambin su error standard. Para el HVS-I, usamos los porcentajes lentos y rpidos dados por Boniato y Salzano (1997): 10,3% (+/- 1.35%)/milln de aos (Myr) y 15% (+/- 1.97%)/milln de aos. Para la data establecida del HVS-I + HVS-II, usamos los siguientes dos porcentajes: 8,85% (+/0,9%)/milln de aos y 11,5% (+/- 1,15%)/milln de aos. Ambos porcentajes lentos fueron tomados de Horai et al. (1995), y los porcentajes rpidos fueron tomados de Ward et al. (1991) (en el caso del HVS-I) y Stoneking et al. (1992) (en caso de HVS-I + HVSII) en donde los standard de error fueron aquellos dados por Horai et al. (1995) o estimados usando su aproximacin. El parmetro a (alfa) para nuestra data establecida fue calculado por medio del mtodo de Yang y Kumar (1996) y el programa Pamp (del Paml package [Z. Yang; http://iubio.bio.indiana.edu]), usando los rboles calculados por el uso de la distancia K2P. DISTRIBUCIONES DESIGUALES La historia evolutiva de los cuatro haplogrupos fue tambin examinada, usando la aproximacin de la distribucin desigual (Rogers and Harpending 1992; Rogers 1995; Rogers y Jorde 1995). Los parmetros relevantes fueron calculados por medio del mtodo de momentos (Rogers 1995), por el programa Mmest (del Mismatch package paquete de desigualdad [A. Rogers; ftp://anthro.utah.edu]). El 95% del intervalo de confianza para las fechas de expansin de cada haplogrupo fue estimada en un modo similar a aqul usado en la aproximacin de la diversidad nucletida presentada ms arriba, como es descrita en todos lados (Boniato y Salzano 1997). SIMULACIONES

Rogers y Jorde (1995) mostraron que el nico sentido en el cual la diversidad secuencial puede ser construida como medida de edad es como una estimacin del tiempo durante el cual la poblacin se ha expandido desde un severo cuello se botella. Aunque es claro que el poblamiento de Amrica fue probablemente caracterizado por una reduccin de poblacin seguido por una expansin (Bonatto y Salzano 1997), hay una incertidumbre constante sobre los tamaos de las poblaciones fundadoras y las ms recientes precolombinas (Cavalli-Sforza et al. 1994). Adems, estamos tratando con grupos de secuencias (haplogrupos), no con poblaciones distintivas. Por lo tanto, queremos testear tambin las conjeturas de una pequea poblacin fundadora y una gran expansin, para cada haplogrupo independientemente, para que podamos aplicar mtodos de datacin que usen diversidad de secuencias como medidas de tiempo. Siguiendo el trabajo de Eller y Harpending (1996), diseamos simulaciones de varias situaciones poblaciones estacionarias y expansivas, para probar (1) en cuales condiciones lo emprico estima sera reproducido y (2) si podramos rechazar o aceptar la hiptesis que los haplogrupos fueron estacionarios o se haban expandido y, si el ltimo era verdadero, a qu grado. Especficamente, testeamos en cuan scenario demogrfico las simulaciones daran valores por lo menos tan extremos como los estimados directamente de las muestras, para dos estadsticaslas irregularidades de Harpending (r; Harpending 1994) y las Tajimas D (Tajima 1989). La irregularidad cuantifica y alisan la distribucin (desigual). Harpending et al. (1993) encontraron que las poblaciones en expansin mostraban un valor de r muy pequeo, desde que las distribuciones desiguales tienen la forma de una onda lisa. De todos modos, Aris-Brosou y Excoffier (1996) mostraron que una alta heterogeneidad de sustituciones entre los litios (un parmetro de alfa baja para la distribucin gamma) podra causar que una poblacin estable muestre distribuciones muy lisas. Por lo tanto, en esos casos, el resultado de la simulacin usando la irregularidad de la distribucin no podra distinguir sin demoras entre los scenarios estacionales y expansivos. Ms an, ellos tambin mostraron que, aunque una (gran) expansin de poblacin cambie el Tajimas D a valores negativos (significativos), el porcentaje de substitucin heterognea tiene el efecto opuesto, moviendo el Tajimas D a un valor ms positivo para un porcentaje de sustitucin ms desigual. Desde que la regin de control (CR) del ADNmt en humanos es conocida por tener heterogeneidad en el porcentaje de sustitucin (Kocher y Wilson 1991; Wakeley 1993), Tajimas D podra ser la mejor estadstica para distinguir entre poblaciones estacionarias y expansivas ms que el r usado por Eller y Harpending (1996) en sus simulaciones. Las simulaciones fueron realizadas por el programa Mmgen (del Mismatch package; ver arriba), el cual usa el modelo de conglutinacin para generar historias simuladas asumiendo algunos parmetros de entrada, como el tamao de la distribucin desigual, nmero de sitios, tamao de la muestra, y tiempo desde la expansin. Todos los parmetros de entrada anteriores fueron calculados de la data emprica para cada haplogrupo, para que las simulaciones reflejaran lo ms cercanas posible a los parmetros demogrficos actuales para cada haplogrupo. Los otros parmetros de inters son los grados de expansin de la poblacin y su tamao final, en unidades de 0, donde 0= 2Nfu, con Nf denotando el nmero de mujeres y u denotando el porcentaje de mutacin para la regin nucletida por generacin (ver Rogers y Harpending 1992). Modificamos el programa para que generara distribuciones empricas de 10.000 D y valores r para cada combinacin del final 0 y el grado de expansin. El final 0 se

alineaba desde 0,1 a 1.000, y el grado de expansin se alineaba desde 1 (para una poblacin estacionaria) a 100.000.000. La mayora de las simulaciones fueron realizadas considerando solo una poblacin final de apareamiento al azar, pero para testear si la estructura geogrfica poblacional podra influenciar los resultados, algunas simulaciones fueron tambin generadas considerando que, luego de la expansin, la poblacin se dividira en 3 o 20 grupos. Aparte del modelo de "sitios infinitos", tambin hicimos simulaciones usando un modelo de mutacin que toma en cuenta la heterogeneidad de los porcentajes de mutacin en la regin de control (CR) del ADNmt (Rogers et al. 1996), usando el modelo de sustitucin de "sitios finitos con porcentajes de distribucin gamma" (Rogers et al. 1996). El parmetro a de la distribucin gamma usados en las simulaciones fueron aquellos calculados para nuestras datas establecidas, como se describi antes. Como en el trabajo de Eller y Harpending (1996), un scenario especfico del final 0 y el grado de expansin fue rechazado si el< 500 (<5%) de las simulaciones mostraron una D o un valor r ms extremo que aquel calculado de la data. RESULTADOS De los 720 nativo americanos secuenciados por el HVS-I, 592 (82%, comprendiendo 125 secuencias diferentes) tienen secuencias con todos los marcadores de uno de los cuatro haplogrupos (los marcadores de sustitucin de los cuatro haplogrupos ms importantes son aquellos listados por Forster et al.1996 como las secuencias fundadoras A2, B, C, y D1). Para el HVS-I + HVS-II, este valor es 161/217 (74%, comprendiendo 52 secuencias diferentes). Si excluimos la muestra de los Yanomami de Easton et al. (1996), esos valores son el 87% para el HVS-I y el 89% para el HVS-I + HVS-II, respectivamente. Para minimizar la posibilidad de la ocurrencia de mltiples, todava cercanamente relacionadas, secuencias fundadoras de cada haplogrupo, lo que resultara en la sobreestimacin de los valores de diversidad desde la colonizacin, usamos para cada haplogrupo solamente las secuencias que tienen todos sus marcadores de sustitucin. Haciendo esto, tratamos de asegurarnos que todas las secuencias analizadas aqu fueran derivadas de tan solo una secuencia fundadora de cada haplogrupo. Tambin, usamos para las secuencias del haplogrupo A a Amerindios, NaDene, y Eskimo, desde que hemos mostrado (Bonatto y Salzano 1997) que todas tienen un origen comn. De todos modos, es importante notar que la diversidad de valores para el haplogrupo A (ver debajo) no cambiaron demasiado si removemos las secuencias no amerindias. El rasgo sorprendente de las dos datas colocadas es que, para cada haplogrupo, los polimorfismos, especialmente en el HVS-I, o existen en solo una secuencia o son compartidos por una pequea fraccin de las secuencias, no ocurriendo una sustitucin en un >20% de las secuencias de los haplogrupos (no mostradas). De acuerdo a Slatkin y Hudson (1991), este patrn es exactamente lo que esperaramos en una situacin de crecimiento exponencial de una sola secuencia ancestral (de la cual las secuencias descendientes heredaron las sustituciones del marcador).

DIVERSIDAD NUCLEOTIDA DE LOS HAPLOGRUPOS Un requerimiento importante en la teora coalescente (Donnelly y Tavar 1995) y los mtodos de distribucin desigual (Rogers y Jorde 1995) es el uso de las muestras aleatorias de los genes de la poblacin en estudio. La poblacin del problema en el cual estamos interesados (el poblamiento de las amricas) es la totalidad de los nativos americanos, no los grupos locales. De todos modos, dos individuos de una misma poblacin local tendrn una probabilidad ms grande de estar cercanamente relacionados que dos individuos de diferentes poblaciones, especialmente si consideramos el tamao generalmente pequeo de las poblaciones locales nativo americanas (Salzano y CallegariJacques 1988). El uso de la frecuencia de las secuencias dentro de la poblacin local, altamente afectada por la historia demogrfica reciente de cada poblacin, menospreciar la diversidad nucletida de los norteamericanos como un todo. Por otro lado, la ocurrencia de la misma secuencia en distintas poblaciones es probable que hubiera sido afectada por eventos ms antiguos. Por lo tanto, desde que estamos interesados en la historia evolutiva temprana del continente, para la estimacin de la diversidad nucletida de dentro de los haplogrupos, usamos la frecuencia de las secuencias entre poblaciones (ver tambin Boniato y Salzano 1997). Para estimar la frecuencia entre poblaciones de cada una de las secuencias diferentes en la colocacin de data (data set), contamos solo el nmero de poblaciones en las cuales ocurri, sin tomar en cuenta su frecuencia dentro de las poblaciones. La tabla 1 muestra las diversidades nucletidas (con su 95% de intervalo de confianza- CI) para los cuatro haplogrupos, para ambas HVS-I y HVS-I + HVS-II. El rasgo ms notable es la alta similitud de los valores en cada colocacin de data, especialmente para el HVS-I (con tamaos de muestra ms altos), la que tiene un porcentaje de 0,80% - 0,96% con una media del 0,86%. Ntese que, por el contrario, los estudios con el RFLP (Torroni et al 1994) encontraron que el haplogrupo B tena una diversidad mucho ms baja que los otros tres. Para la data del RFLP la media de la diversidad del valor de los otros tres haplogrupos es 2,2 veces ms ala que la diversidad del haplogrupo B, mientras que esta relacin para el control de regin es de solo 1,1. Esta proporcin para la data del control de regin es mantenida hasta cuando la frecuencia de las secuencias de dentro de la poblacin es usada, siendo el tamao de la muestra de unos 563 individuos, usados en los estudios de la RFLP. Por lo tanto, esta diferencia entre las secuencias de control de regin y la data del RFLP no pueden ser ni explicadas por un tamao de muestra o atribuidas a diferentes vas en las cuales las frecuencias de los haplogrupos fueran tratados, ms probablemente siendo causa de las diferentes poblaciones, regiones del ADNmt estudiados, o definiciones de haplogrupos. La diversidad de valores para la colocacin de data del HVS-I + HVS-II fueron ms variables, posiblemente por los tamaos de las muestras ms pequeos y, tal vez, el alto porcentaje de heterogeneidad de mutacin en el HVS-II (ver debajo). Los valores de divergencia entre los haplogrupos son ms altos que la diversidad dentro de los haplogrupos, y el promedio entre todas las comparaciones de los pares(pairwise) es ms de tres veces (para el HVS-I) y ms de dos veces (para el HVS-I + HVS-II) ms alto que los promedios dentro de cada haplogrupo (ver tabla 1). Este resultado apoya la nocin que la divergencia de los haplogrupos (no diversificacin) comenz antes de su entrada a las Amricas y que cualquier anlisis que enracime los

diferentes haplogrupos (e.g., las distribuciones desiguales de Horai et al. 1993 y ArisBrosou y Excoffier 1996) darn resultados de eventos que ocurrieron mucho antes que la colonizacin del nuevo mundo. A la luz de la existencia del porcentaje de heterogeneidad en la regin de control del ADNmt (Wakeley 1993) y sus efectos en la estimacin de la distancia verdadera del ADN (Yang 1996), la diversidad de valores fueron calculados por medio de la distancia gamma de Tamura-Nei. El parmetro a (alfa) usado en los clculos fue estimado por el nuevo mtodo de Yang y Kumar (1996). Para la colocacin de data (data sets) HVS-I y HVS-I + HVS-II de los nativos americanos, los valores de a (alfa) fueron .5 y .16, respectivamente, en aproximacin cercana con aquellos calculados para colocacin de datos similares (Wakeley 1993; Yang y Kumar 1996). El nmero bajo para el HVS-I + HVS-II es a causa del valor extremadamente bajo para la regin del HVS-II, la que sola ha tenido un a (alfa) estimado de .07. DISTRIBUCIONES DESIGUALES Una distribucin de forma de una ola del nmero de diferencias nucletidas entre los pares de individuos dentro de una poblacin, la distribucin desigual, es una firma de una expansin poblacional en el pasado (Rogers y Harpending 1992), y las simulaciones extensivas han corroborado este descubrimiento (Slatkin y Hudson 1991; Rogers y Harpending 1992; Harpending et al. 1993). La figura 1 muestra las distribuciones desiguales para los haplogrupos de los Nativos Americanos, para la colocacin de data del HVS-I y el HVS-I + HVS-II. Los perfiles de ola de los haplogrupos son marcadamente similares uno con el otro, sugiriendo que estas secuencias fueron tomadas de una misma poblacin ancestral, la que fue sometida a una gran expansin en el pasado. Las olas no son tan similares para la data del HVS-I + HVS-II, probablemente por el pequeo tamao de las muestras y el alto porcentaje de mutacin heterognea en la regin de HVS-II. Los valores irregulares para la colocacin de data (data sets) del HVSI (tabla 2) son muy bajos, como generalmente se encuentra en poblaciones expansivas (Harpending et al. 1993). Varios estudios han mostrado que la filogenia de una muestra de genes tomados de una poblacin que ha experimentado una gran expansin luego de un cuello de botella, tiene una forma de rbol estrella (Di Rienzo y Wilson 1991; Slatkin y Hudson 1991; Rogers y Jorde 1995). La figura 2 muestra el rbol de NJ de las 125 secuencias de HVS-I distintas de los cuatro haplogrupos; solo dos secuencias D no se agruparon con otras de sus respectivos haplogrupos. El soporte estadstico para los haplogrupos es alto, teniendo todos una probabilidad de confianza (CP) de >85%, con la excepcin del haplogrupo D, el cual no tiene marcadores nicos (ver Foster et al. 1996). El perfil ms remarcable de este rbol es que cada haplogrupo presenta un sub rbol con una clara forma de estrella, similar a la que fue encontrada con el uso del rbol de mnima distancia (minimumspanning tree) (no mostrado). Este resultado nuevamente apoya la hiptesis de una gran expansin de poblacin para los nativo americanos. RESULTADOS DE LA SIMULACION Los valores D Tajima para los haplogrupos fueron significativamente negativos para la colocacin de data (data set) del HVS-I (tabla 2). Aris-Brosou y Excoffier (1996)

demostraron que una gran (>100 enlazadas) expansin de poblacin mueve al D Tajima a valores significativamente negativos pero que el porcentaje de mutacin heterogneo lo cambia a valores ms positivos. Por lo tanto, los valores D significativamente negativos, obtenidos para los cuatro haplogrupos cuando la data del HVS-I son usados, a pesar de la existencia de un porcentaje de mutacin heterogneo moderado ( a= .5) en esta regin, es un fuerte apoyo para la gran expansin que afectaron los cuatro haplogrupos. De todos modos, los ms altos porcentajes de mutacin heterognea (a = .16) en la data del HVS-I + HVS-II cambiaron los valores D a nmeros dentro del 95% del intervalo de confianza (CI), aunque todava estn moderadamente negativos, como fueron encontrados por ArisBrosou y Excoffier (1996) en sus simulaciones. Un a ms baja (.07) para solo la regin HVS-II cambi la D Tajima por los haplogrupos B y C a valores positivos (no mostrado). La figura 3 muestra el resultado de las simulaciones para cada haplogrupo cuando las estadsticas de la D Tajima y el modelo de porcentaje finitesimal gamma son usados para la simulacin. Los valores sombreados ms oscuros denotan especficas combinaciones de grado de expansin y valor para el final 0 (tamao de poblacin) que no podra ser rechazado por las simulaciones; eso es, esos scenarios en los cuales >500 (>5%) de las simulaciones resultaron en un valor de D ms bajo que el estimado para nuestra colocacin de data (data set) del HVS-I. El mnimo grado de expansin no rechazado por las simulaciones fue de 100-fold (100-enlazadas) para los haplogrupos A, B y C y 50 enlaces (50-fold) para D. La tabla 2 presenta el tamao mximo, de la poblacin inicial, que no fue rechazada por las simulaciones (el tamao del 0 inicial fue calculado dividiendo el 0 final por el grado de expansin para cada combinacin de valores que no fueron rechazados, y el valor mximo formado para cada haplogrupo. De estos valores de 0 inicial, el nmero efectivo de mujeres fue calculado por 0o= 2Nfu, como lo dado ms arriba. Estos resultados sugieren que cada haplogrupo nativo americano, como est definido aqu, fue fundado por un pequeo nmero de mujeres. Desde que los valores ms arriba son el nmero de mujeres en la poblacin fundadora que transportaron las secuencias fundadoras de cada haplogrupo, para estimar el tamao de toda la poblacin fundadora para los cuatro haplogrupos deberamos sumar los valores individuales para cada haplogrupo, lo que resulta (cuando usamos el porcentaje de 10,3%) en un valor mximo de 2000 mujeres y una poblacin fundadora de <5000 individuos. La posible existencia de otros menos exitosos haplogrupos fundadores (eg. Ver Foster et al 1996; Merriwether y Ferrell 1996), que podra contarse para el 10% del ADNmt ahora encontrado en las Amricas, podra incrementar estos estimativos en algn grado. Estas figuraciones, aunque aproximadas, sugieren que durante el proceso de colonizacin la poblacin ancestral nunca fue mayor que 10.000 individuos. El uso del modelo de sitios finitos con porcentajes de distribuciones gamma en las simulaciones (ms que el irreal, modelo de sitios infinitos) (eg. Ver Eller y Harpending 1996) transform a los test en ms .. en relacin a los scenarios que podran ser rechazados. Tambin, en distinguir el scenario estacional del scenario expansivo, el D Tajima tuvo un poder discriminatorio ms alto que aquel de las estadsticas.., especialmente cuando un modelo de porcentaje de mutacin heterogneo fue usado en las simulaciones (no mostrado). El uso final, de poblaciones estructuradas geogrficamente,

en vez de una reproductiva al azar, en las simulaciones tuvo un efecto no cualitativo en los test. ESTIMANDO LA EDAD DE LOS CUATRO HAPLOGRUPOS DE ADNmt DE LOS NATIVO AMERICANOS Todos los resultados que hemos presentado hasta el momento fuertemente argumentan a favor de la hiptesis que, en el proceso de colonizacin de las Amricas haba, para cada haplogrupo, un cuello de botella, seguido por una gran (>100-enlaces) expansin. Por lo tanto, ahora tenemos justificacin para el uso de la diversidad secuencial encontrado en cada haplogrupo nativo americano como medida de la ltima edad de expansin. La tabla 1 muestra el promedio de edad y su 95% de Intervalo de Confianza (CI) para cada haplogrupo, para ambas colocaciones de data y todos los porcentajes de mutacin. Los tiempos de diversificacin son ambos muy similares el uno al otro y entre la colocacin de data del HVS-I y el HVS-I + HVS-II. El promedio de edad para los valores de HVS-I fueron 42.000 y 29.000 AP, y aquellos para los valores de HVS-I + HVS-II fueron 43.000 y 33.000 AP, para los porcentajes de sustitucin ms lentos y ms rpidos, respectivamente. Los saltos ms bajos estimados para los promedios fueron 25.000 (HVS-I) y 29.000 AP (HVS-I + HVS-II), y el mnimo valor para todas las estimaciones fue 23.000 AP, para el haplogrupo C con el uso de la data de HVS-I + HVS-II. El salto ms alto de edad fue 50.000 AP. El tiempo promedio de divergencia entre los haplogrupos fue 110.000 AP, siendo, en general, tres veces ms alto que la edad de los haplogrupos. Las edades estimadas por el uso del acercamiento por distribucin desigual, por medio del mtodo de los momentos, fueron idnticos o muy similares a aquellos calculados por el uso de la diversidad nucletida (no mostrada), indicando luego un fuerte cuello de botella inicial (Bonatto y Salzano 1997), aunque el intervalo de confianza del mtodo de la distribucin desigual fuese mayor. DISCUSION Cuando consideramos principalmente la data del HVS-I, el patrn de polimorfismos compartidos, la distribucin desigual (fig.1), el rbol filogentico (fig.2), y los resultados de simulacin (fig.3), todos sugieren que los cuatro haplogrupos principales sufrieron un cuello de botella, seguido por una gran expansin poblacional. Esos resultados dan un gran apoyo para nuestro futuro unos de la diversidad secuencial dentro de cada haplogrupo como un estimativo del tiempo desde aquel cuello de botella. La verdadera similitud de diversidad de valores encontrados para los cuatro haplogrupos ambos con la colocacin de data (data set) del HVS-I y con la data del HVS-I + HVS-II, fuertemente sugiere que todas se expandieron aproximadamente al mismo tiempo y, por lo tanto, que probablemente vinieron de la misma poblacin resultando en la aceptacin de un modelo de una sola migracin sugerido por varios estudios recientes (Merriwether et al. 1995; Forster et al. 1996; Colman et al. 1996; Bonatto y Salzano 1997). En nuestro estudio previo (Bonatto y Salzano 1997), usando principalmente las secuencias del haplogrupo A, concluimos que aquella data de ADNmt fuertemente indica que todos los nativo americanos originaron de un solo evento de colonizacin que ocurri en Beringia >22.000 AP, y posiblemente hace 30.000-40.000 AP. Sugerimos un scenario, basado en los trabajos de Szathmary (ver Szathmary, 1993) en el cual las poblaciones ancestrales nativo americanas se establecieron en el territorio de

Beringia durante algn tiempo antes que se expandieran. Eventualmente cruzaron el corredor libre de hielo de Alberta y colonizaron el resto del continente americano. El colapso de ese corredor, 25.000-14.000 (Hoffecker et al., 1993) hace 30.000 11.000 AP (Lemmen et al, 1994), isol la gente todava viviendo en Beringia, de los cuales se originaron los Na-Dene y los Eskimos (con su reducida diversidad de ADNmt en general); aquellos al sur de las capas de Hielo se convirtieron en los hablantes del amerindio. Los presentes resultados para la edad de diversificacin de los cuatro haplogrupos ms importantes concuerdan muy bien con esos estimativos. Cuando solo son considerados los valores medios, estas estimaciones sugieren una fecha muy temprana (30.000-40.000 AP) para los comienzos de la diversificacin para la poblacin ancestral nativo americana, con un salto ms bajo de 25.000 AP. Por lo menos dos tipos de evidencia apoyan la idea que la diferenciacin de la secuencia de haplogrupos probablemente comenz durante la colonizacin de Beringia y no en Asia antes del proceso de colonizacin: 1) nuestras estimaciones de una expansin antigua de poblacin de un enlace de >/ 100 sugiere que la diversificacin comenz durante un intenso proceso de colonizacin; y 2) si la expansin haba ocurrido en algn otro lado en Asia, entonces uno tendra que encontrar estas secuencias, con todos los marcadores para cada haplogrupo, en un alto nmero y frecuencia, similar al 90% de frecuencia encontrado en los nativo americanos; de todos modos, solo las secuencias fundadoras de cada haplogrupo han sido encontrado en Asia hasta el momento, y han sido encontradas en una frecuencia muy baja (ver Forster et al, 1996; Colman et al., 1996; Bonatto y Salzano, 1997). Las pocas secuencias fundadoras adicionales para el haplogrupo A que han sido sugeridas en las Na-Dene y Eskimo (ver Forster et al, 1996)- son probablemente derivadas y sern discutidas en otro lado (data no publicada por los autores). Estamos de acuerdo que algunos haplogrupos fundadores adicionales (como el grupo X de Forster et al., 1996; ver tambin Bailliet et al, 1994; Merriwether y Ferrell, 1996) podran existir, adems de los cuatro ms importantes estudiados aqu. De todos modos, ellos constituyen solo un 10% de las secuencias ahora encontradas en las Amricas y, por sus muestras muy pequeas en tamao, no pudieron ser analizadas en el estudio. Desde que analizamos cada haplogrupo separadamente, y desde que el nmero de haplogrupos no fue un parmetro relevante, incluyendo esos haplogrupos fundadores putativamente adicionales, no debera cambiar de forma significativa los resultados aqu presentes. Algunos estudios recientes tambin trataron de estimar el tiempo de entrada en las Amricas por medio de los valores de diversidad de los haplogrupos, en base de la data RFLP (Torroni et al., 1992,1994) y la variacin de la secuencia de la regin de control (Forster et al, 1996). Enfatizamos que nuestros intervalos de confianza inferidos tomaron en cuenta la heterogeneidad del porcentaje de mutacin y la variabilidad de la diversidad nucletida, mientras que las estimaciones de otros estudios consideraron, como mucho, solo una fuente de error; el intervalo de confianza (CI) por sus estimaciones sera mucho ms amplia que la extensin que han provedo. Con respecto a las hiptesis de Torroni et al (1992, 1994) nuestros resultados anteriores no apoyan idea de una migracin independiente Na-Dene (Bonatto y Salzano, 1997), y nuestros anlisis presentes tampoco apoyan su sugerencia de una migracin del haplogrupo B ms reciente. Igualmente, ni la propuesta de Horai et al de migraciones diferentes hace 14.000 21.000 AP, para cada haplogrupo, ni la hiptesis de una contribucin polinesia para las secuencias del

haplogrupo B halladas en Amrica (ver Bonatto et al, 1996) fue apoyada. En todo caso, el promedio de llegada estimado por Torroni et al (1994) de 26.000-34.000 AP, para los otros tres haplogrupos es muy cercano a nuestras estimaciones (tabla 1). En general, el scenario del poblamiento de las Amricas de Forster et al (1996) es similar al que propusimos (ver arriba Bonatto y Salzano, 1997). Ellos postularon una sola entrada temprana (>20.000 AP) y sugirieron que, aunque los Amerindios colonizaron todo el continente y mantuvieron su diversidad original, los Beringianos (Eskimo + NaDene) redujeron su diversidad, a causa del deterioro climtico hasta el 11.000 AP, en donde se re-expandieron a su tamao actual. Forster et al tambin han presentado edades coalescentes para los haplogrupos de nativo americanos usando una colocacin de data (data set) muy similar a nuestro HVS-I (pero con mtodos muy diferentes) para estimar la edad de los haplogrupos. Aunque no calcularon ningn intervalo de confianza para sus estimativos de edad, sugirieron 20.000-25.000 AP como fecha de llegada para los amerindios, lo que es cercano a nuestras estimaciones de salto ms bajas. Sus edades coalescentes de los haplogrupos, de todos modos, probablemente son subestimaciones del tiempo de la diversificacin desde la entrada de estas poblaciones en las Amricas, desde que estimaron la diversidad de valores en la base de cada haplogrupo dentro de cada tribu en forma separada. Sus resultados recibiran una gran influencia de la historia demogrfica de cada tribu lo que podra cambiar significativamente los antiguos parmetros que estamos interesados en estimar. Un buen ejemplo de esto puede ser visto en su edad estimada para los amerindios de Amrica Central, lo que mostr una edad coalescente ms baja que aquella de Sudamrica. Lejos de sugerir que los amerindios centroamericanos se originaran ms recientemente que los amerindios sudamericanos, este resultado solo refleja que la reducida diversidad de ADNmt encontrada en los grupos Chibcha, de las que todas las secuencias de ADNmt de Centroamrica vienen. La reducida diversidad de ADNmt en los Chibchas se piensa que ocurri a causa de eventos recientes (Colman et al, 1995).

You might also like