You are on page 1of 10

Nguồn gốc người Việt – bài 3

Đỗ Ngọc Giao 03-Jan-2023

3. Ba nhóm người xưa


Ở bài trước, ta được biết thổ dân Hòa Bình là một lớp ‘tổ’ đã truyền lại DNA cho người Việt theo
cách 2 trong hình 1. Đàng khác, thổ dân Hòa Bình cũng là một lớp tổ đã truyền lại DNA cho đàn ông
người Việt theo cách 1 trong hình 1, mà ta sẽ tìm hiểu ở bài này.

Hình 1. (Rishishwar and Jordan1)

3.1. Y-DNA haplogroup

Trước hết ta làm quen đôi ba thuật ngữ khoa học cần thiết.
DNA (deoxyribonucleic acid) là một dãy những ‘nucleotide’ nối nhau, mỗi nucleotide mang một
cái ‘base’ có thể là adenine (‘A’), guanine (‘G’), cytosine (‘C’), hoặc thymine (‘T’). Thứ tự của
những nuceotide trên dãy, theo một hướng nào đó làm chuẩn, là bản tin hướng dẫn cách gầy dựng và
giữ gìn một cơ thể. DNA thường gồm hai dãy giống như hai cạnh của một cái thang mà mỗi bậc
thang là một cặp base (base pair, viết tắt ‘bp’) gắn với nhau: A gắn với T, C gắn với G (hình 2).

Hình 2. (Haplogroup.org2)

1
DNA gói thành những sợi ‘chromosome’ trong mỗi cái nhân tế bào; con người có 23 cặp
chromosome với hơn 3 tỷ bp, gồm 22 cặp ‘autosome’ và một cặp ‘sex chromosome’ XY, riêng sợi Y
của đàn ông thì có chừng 59 triệu bp. DNA trên autosome truyền từ đời này sang đời kia thì không
còn nguyên xi mà lần lần mất bớt, bởi hai sợi autosome trong từng cặp bị pha với nhau (crossing-
over) mỗi khi tạo ra ‘giao tử’ (hình 3).

Hình 3.

Song le, sợi Y thì khác: nó có thể pha với sợi X ở một chút ngoài rìa, nhưng khúc giữa, cỡ 95%
bề dài (gọi là ‘male specific region’), thì không bao giờ pha mà còn nguyên từ đời này sang đời nọ.
Điều đáng nói là DNA truyền tới một đời nào đó thì sẽ xảy ra ‘mutation’, nói nôm na cũng như
một cái lỗi đột nhiên xảy ra khi ‘copy’ DNA từ người cha sang người con, theo nhiều cách, thường là
hai cách như sau:
1. một base bị đổi khác (hình 4), gọi là ‘single nucleotide polymorphism’ (viết tắt ‘SNP’).

Hình 4. (Yourgenome.org3)

2. một hay nhiều nucleotide bị chèn thêm (hình 5) hoặc xóa bớt (hình 6), gọi chung là ‘indel’.

Hình 5. (Yourgenome.org3)

2
Hình 6. (Yourgenome.org3)

SNP gần một tỷ năm mới xảy ra một lần trên một bp,4 nên có thể coi như không bao giờ có một
cái SNP thứ hai nảy ra ngay trên cái SNP thứ nhứt, và một cái SNP cũng khó nảy ra hai lần; nói cách
khác: SNP, và indel nữa, là những biến cố có-một-không-hai (unique-event polymorphism). Bởi vậy
nếu bạn với tôi đều mang giống nhau một cái SNP trên sợi Y (viết tắt ‘Y-SNP’) thì chắc chắn hai ta
đều là dòng dõi của một ông đầu tiên mang cái Y-SNP đó, sống cách nay 6000 năm và tên là Mít
chẳng hạn.
Giả sử không những bạn với tôi mà hàng triệu người khác cũng mang cái Y-SNP đó, thì cái Y-
SNP đó trở thành một cái marker (dấu hiệu) chắc chắn để phân biệt nhóm đực rựa mang marker đó
với một nhóm đực rựa khác không mang marker đó, nhóm đực rựa mang marker đó sẽ được gọi là
một ‘Y-DNA haplogroup’ (viết tắt ‘yhg’). Ông Mít là ‘cố tổ’ (founder) của cái yhg đó, nhưng ‘ông tổ
chung gần nhứt’ (most recent common ancestor) của nhóm người trong yhg đó mà còn sống ngày
nay (gồm cả bạn với tôi) thì không phải ông Mít mà là ông Xoài, một người cháu của ông Mít sống
cách nay mới 2000 năm thôi.
(Bạn cũng có thể mang một cái mutation mới nảy ra mà cha ông bạn chưa có, hoặc một cái
mutation mới nảy ra vài trăm năm gần đây mà chưa nhiều người có; nếu vậy, cái mutation đó chưa
phải là marker của yhg nào hết mà là một đặc điểm của bạn thôi.)
Ta được biết có nhiều yhg trên thế giới ngày nay và hết thảy những yhg đó, kể cả hai yhg đã mất
là Denisovan và Neanderthal, đều nảy ra từ một ông ‘thủy tổ’ kêu bằng ‘Y-Adam’ ở châu Phi, giống
như những cái cành nảy ra từ gốc của một cái cây, gọi là ‘cây yhg’ (Y-DNA haplogroups tree). Nói rõ
hơn, vào thời của Y-Adam, không phải có một mình ổng mà có nhiều người khác nữa, nhưng ổng là
người để lại cháu chắt còn sống cho tới ngày nay (gồm cả bạn với tôi) trong khi đó cháu chắt của
những ông kia nếu có thì đã chết hết trơn.
Hình 7 là ‘version’ 15.73 mới nhứt của cây yhg tới khi viết bài này, do International Society of
Genetic Genealogy (viết tắt ‘ISOGG’), một nhóm học giả phương tây, lập ra và ‘update’ hàng năm từ
2005.

3
Hình 7. vẽ lại theo ISOGG5.

Trong hình, các ô màu vàng là những yhg bên ngoài châu Phi ngày nay. Ban đầu, C, D và F ra
khỏi châu Phi, về sau, từ F nảy ra những yhg khác. A0-T là cái gốc của mọi yhg ngày nay ở trong và
ngoài châu Phi. Dựa theo chứng cớ rằng mọi người bên ngoài châu Phi ngày nay đều mang chừng
2% DNA của nhóm Neanderthal sau một lần lai với nhóm này trong khoảng 49900–59400 năm
trước, Haber et al6 cho rằng ba nhóm C, D và F đã rời châu Phi trong khoảng 50300–59400 năm
trước.
Mỗi yhg có nhiều ‘sub-haplogroup’, cũng như một cành có nhiều nhánh. Bảng dưới là thí dụ
những marker nảy ra và tích tụ trong những sub-haplogroup của K được biết tới nay (hình 7 có nêu).

K-M9
K1 M9, L298 K2 M9, M526
K1a M9, L298, M20 K2a M9, M526, F549
K1b M9, L298, M184 K2b M9, M526, M1221
K2c M9, M526, P261
K2d M9, M526, P402

4
Ở bảng trên, chữ đậm là marker đặc trưng của một yhg mà bạn cần ‘test’ để coi mình có phải là
thành viên của yhg đó hay chăng. Nếu bạn test có L298, thì yhg của bạn là K1 (viết tắt ‘K-L298’).
Nếu bạn test có M20, thì yhg của bạn là K1a (viết tắt ‘K-M20’). Nhưng nếu bạn test có M9 mà
không có những mutation bên dưới, thí dụ L298, thì bạn được xếp vô K*, ‘paragroup’ của K (viết tắt
‘K-M9*’). Hoặc nếu bạn test có L298 mà không có những mutation bên dưới, thí dụ M20, thì bạn
được xếp vô K1*, paragroup của K1 (viết tắt ‘K-L298*’).
Ngày nay trên thế giới, yhg nào đông nhứt? Hình 8 cho thấy % của những yhg trong 1233 mẫu
đàn ông ở 26 nơi, kể cả 46 mẫu người Việt ở Sài Gòn.7 Theo đó, 3 yhg đông nhứt là E ở châu Phi, R
ở châu Âu và O ở châu Á.

Hình 8.

Dưới đây là yhg của một số nhơn vật nổi tiếng bên Tây.8
• Albert Einstein (1879–1955): E-Z830.
• Zinedine Zidane (1972–): E-M81.
• Otzi the Iceman (xác ướp tự nhiên ở châu Âu lối 5300 năm trước): G-L91.
• William Faulkner (1897–1962): I-Z141.
• Bill Gates (1955–): I-Y3684.
• George Washington (1732–1799): R-L21,
• Ernest Hemingway (1899–1961): R-FGC15335.
Nói thêm, dữ liệu cũng cho thấy đôi ba trường hợp khó hiểu, thí dụ một người Ấn ở Anh và một
người Việt ở Sài Gòn: hai anh này chẳng mang bất cứ một cái marker nào đã biết của những yhg A0,
A1, B, C, D, E, G, H, I, J, L, N, O, Q, R, T, thành ra không thể xếp hai ảnh vô bất cứ yhg nào.7
Tóm lại, xếp đàn ông vô những yhg, theo các marker đặc trưng không hề thay đổi từ đời này sang
đời nọ, là một việc mà người ta đang làm trên khắp thế giới. Và nếu bạn muốn tự mình đi tìm nguồn
gốc của mình, khỏi cần nhờ những vị học giả đáng kính như Bình Nguyên Lộc (1914–1987), Nguyễn
Phương (1921–1993) và Nguyễn Khắc Ngữ (1935–1992) đi tìm giùm (mà tìm hoài chẳng thấy), thì,
trước hết, bạn nên test Y-DNA để biết mình ở yhg nào – vì thường thì mỗi yhg nảy ra ở một nơi khác
nhau.

5
3.2. Ba yhg xưa ở Đông Nam Á

Hình 9-10-11 cho thấy 80–90% trong những nhóm người Đông Nam Á và Hán ngày nay là yhg
O, phần còn lại là những yhg khác kể cả 3 yhg xưa nhứt: C, D, F. Riêng người Việt còn dưới 10% ở
C và dưới 5% ở D.

Hình 9. vẽ lại theo dữ liệu của Trejaut et al.9

Hình 10. vẽ lại theo dữ liệu của He et al.10

6
Hình 11. vẽ lại theo dữ liệu của Karafet et al.11

Ngược lại, ở miền bắc Đông Á thì yhg C đông lắm (hình 12). Nổi tiếng nhứt trong yhg C ắt là
Genghis Khan (1162–1227), người lập nên đế quốc Mongol (1206–1294) có lãnh thổ rộng hơn bất
cứ đế quốc nào khác trong lịch sử.8

Hình 12. vẽ lại theo dữ liệu của Xue et al.12

C, D và F cũng còn lác đác trong những nhóm thiểu số nói tiếng Austroasiatic ở Đông Nam Á và
Hmong-Mien ở miền nam Đông Á ngày nay, theo dữ liệu của Cai et al,13 mà tôi không vẽ hình ra
đây. Nói tóm lại, 3 yhg xưa nhứt C, D, F ngày nay vẫn còn trong một vùng rộng minh mông ở nửa
phía đông châu Á, riêng Đông Nam Á thì còn đủ cả 3 yhg (hình 13).

7
Hình 13. (Hallast et al14)

Tới đây, ta đã biết:


• [đàn ông] người Việt ngày nay gồm ít nhứt 4 yhg C, D, N và O, chưa tính những sub-haplogroup
của 4 yhg đó (hình 9);
• hai nhóm [đàn ông] ở C, D là hai nhóm trước nhứt có mặt ở nơi ngày nay là miền bắc Việt Nam.
Vậy hai nhóm người Việt ở C và D có nguồn gốc từ đâu?
Trước hết, ta để ý rằng vùng đất có C, D, F ở Đông Nam Á và miền nam Đông Á (hình 13) thì
xưa cũng là vùng đất của ‘văn hóa Hòa Bình’ (vùng gạch chéo trong hình 14).

Hình 14. (Zeitun et al15)

8
Kế đến, ta biết yhg của hai mẫu thổ dân Hòa Bình như bảng dưới.16

mẫu ‘date’ (BP) yhg


Lào (La368) 7950–7794 C-F3393
Malaysia (Ma911) 4415–4160 D-M174

Dựa theo dữ liệu nêu trên, và trong khi chờ thêm dữ liệu mới hơn, ta suy ra rằng:
• Hai nhóm [đàn ông] người Việt ngày nay ở C và D (chừng 10% dân số) là dòng dõi của thổ dân
Hòa Bình, với cái gốc gần nhứt trong khoảng 10 ngàn năm qua là Đông Nam Á (Lào, Malaysia),
xa hơn là Nam Ấn,17 và xa nhứt là châu Phi.
• Thổ dân Hòa Bình, với cái gốc gần nhứt là Vân Nam trong khoảng 40 ngàn năm qua (coi lại bài
trước), cũng là lớp tổ chung của những nhóm đàn ông ở C, D, F khắp Đông Nam Á và miền nam
Đông Á ngày nay.
3.3. Thảo luận

Trước đây, đại chúng thưởng hiểu ‘người Việt’ nói chung như một nhóm ‘thuần khiết’ và gán cho
nhóm đó vài cái nhãn mơ hồ, thí dụ ‘chủng XYZ’ hay ‘Lạc Việt’, để dùng làm tên gọi suông mà thôi,
chớ chẳng nói lên ý gì rõ ràng dựa theo khoa học (hình 15a).
Ở bài trước, ta hiểu rằng người Việt đã nhận ‘genome’ của nhiều lớp người xưa trong đó có thổ
dân Hòa Bình (hình 15c). Ở bài này, ta hiểu thêm rằng đàn ông người Việt đã nhận Y-DNA của nhiều
lớp người xưa trong đó cũng có thổ dân Hòa Bình, và, như vậy, đàn ông người Việt gồm nhiều nhóm
khác nhau ở những yhg khác nhau (hình 15b, vẽ lại theo dữ liệu của Trejaut et al9). Hai cách hiểu sau
này (hình 15b, 15c), dựa theo kết quả nghiên cứu của khoa học phương Tây trong vài chục năm gần
đây, khắp thế giới đang chấp nhận. Thiển nghĩ người Việt cũng nên làm theo đó, mạnh dạn gạt bỏ
cách hiểu lỗi thời ở hình 15a.

Hình 15.

Ở trên tôi đã nêu rằng nếu bạn biết yhg của mình thì bạn có thể biết nguồn gốc của mình. Nhưng
nếu bạn tò mò muốn biết cuốn gia phổ của dòng họ nhà bạn, từ ông tổ 5–10 đời trước tới nay, là
trúng hay trật, thì bạn càng cần phải biết yhg của bạn và ít nhứt hàng chục người [đàn ông] khác nữa
trong dòng họ. Giả sử bạn và những người đó đều ở yhg O1a1 chẳng hạn, thì bạn có thể tạm thời tin
rằng gia phổ nhà mình là trúng. Nhược bằng mọi người đều ở yhg O1a1 mà bỗng dưng lòi ra một
anh ở yhg O2b2 thì gia phổ nhà bạn chưa đáng tin đâu.

9
Chót hết là một mẩu chuyện vui. Đã xảy ra bên Tàu. Gia phổ của dòng họ Khổng Tử (551–479
BCE).18
Theo kết quả test Y-DNA của hơn 1000 đực rựa được cho là dòng dõi Khổng Tử, có 46.06% ở C-
M217, 27.01% ở Q-M120, 20.66% ở O-M122 và 6.27% ở những yhg khác. Thiệt là lạ!
Vậy Khổng Tử ở yhg nào?
Xác suất cao hơn hết là Khổng Tử ở C-M217, và, như vậy, theo hình 12, ông ta có lẽ là người
Mongol chớ không phải người Tàu (phần lớn đàn ông người Tàu ngày nay đều ở O-M122).
Tóm lại, cuốn gia phổ của dòng họ Khổng Tử – nghe nói đó là cuốn gia phổ dài nhứt thế giới –
thì chưa đáng tin.

1
Lavanya Rishishwar and I. King Jordan (2020) What are Haplogroups? Living DNA explain.
https://livingdna.com/blog/haplogroups-explained
2
https://haplogroup.org/back-mutation/
3
What types of mutation are there? https://www.yourgenome.org/facts/what-types-of-mutation-are-there/
4
Adamov, Dmitry & Gurianov, Vladimir M. & Karzhavin, Sergey & Tagankin, Vladimir & Urasin, Vadim. (2015).
Defining a New Rate Constant for Y-Chromosome SNPs based on Full Sequencing Data. Russian Journal of Genetic
Genealogy. 7. 1920-2997.
5
International Society of Genetic Genealogy. Y-DNA Haplogroup Tree 2019, Version: 15.73, Date: 11 July 2020,
http://www.isogg.org/tree/ Date of access: 16 Dec 2022.
6
Marc Haber, Abigail L. Jones, Bruce A. Connell, Asan, Elena Arciero, Huanming Yang, Mark G. Thomas, Yali Xue,
and Chris Tyler-Smith, Genetics, A rare deep-rooting D0 African Y-chromosomal haplogroup and its implications for the
expansion of modern humans out of Africa. Genetics, vol. 212, 1421–1428 August 2019.
7
Lawrence Jun (2016) Historic Y haplogroups and whole genome sequencing: a comparison study.
8
Maciamo Hay (2021) Famous people's Y-DNA listed by haplogroup.
9
Trejaut, J.A., Poloni, E.S., Yen, J.C. et al. Taiwan Y-chromosomal DNA variation and its relationship with Island
Southeast Asia. BMC Genet 15, 77 (2014). https://doi.org/10.1186/1471-2156-15-77
10
He J-D, Peng M-S, Quang HH, Dang KP, Trieu AV, et al. (2012) Patrilineal Perspective on the Austronesian Diffusion
in Mainland Southeast Asia. PloS ONE 7(5): e36437. doi:10.1371/journal.pone.0036437
11
Tatiana M. Karafet, Brian Hallmark, Murray P. Cox, Herawati Sudoyo, Sean Downey, J. Stephen Lansing, and
Michael F. Hammer (2010) Major East–West division underlies Y chromosome stratification across Indonesia, Mol. Biol.
Evol. 27(8):1833–1844.
12
Yali Xue, Tatiana Zerjal, Weidong Bao, Suling Zhu, Qunfang Shu, Jiujin Xu, Ruofu Du, Songbin Fu, Pu Li, Matthew
E. Hurles, Huanming Yang and Chris Tyler-Smith, Male Demography in East Asia: A North–South Contrast in Human.
Population Expansion Times, Genetics 172: 2431–2439 (April 2006).
13
Cai X, Qin Z, Wen B, Xu S, Wang Y, et al. (2011) Human migration through bottlenecks from Southeast Asia into
East Asia during Last Glacial Maximum revealed by Y chromosomes. PLoS ONE 6(8): e24282.
doi:10.1371/journal.pone.0024282
14
Pille Hallast, Anastasia Agdzhoyan, Oleg Balanovsky, Yali Xue, Chris Tyler‑Smith, A Southeast Asian origin for
present‑day non‑African human Y chromosomes, Human Genetics (2021) 140:299–307.
15
Valery Zeitoun, Prasit Auetrakulvit, Antoine Zazzo, Alain Pierret, Stephane Frere, Hubert Forestier, Discovery of an
outstanding Hoabinhian site from the Late Pleistocene at Doi Pha Kan (Lampang province, northern Thailand).
Archaeological Research in Asia 18(2019)1–16.
16
Carlos Quiles (2018-2020) Ancient Y-DNA and mtDNA, https://indo-european.eu/ancient-dna/
17
Mahal DG and Matsoukas IG (2018) The geographic origins of ethnic groups in the Indian subcontinent: Exploring
ancient footprints with Y-DNA haplogroups. Front. Genet. 9:4. doi: 10.3389/fgene.2018.00004.
18
http://famousdna.wiki.fc2.com

10

You might also like