Kết quả ước tính độ nhiễm mtDNA của người hiện đại của hai mẫu xương cổ cho thấy mức độ nhiễm của hai trình tự CCNM24WG và CCNM55WG lần lượt là 14% và 21%. Mức độ nhiễm này cần được giảm xuống để cải thiện thêm chất lượng của các phân tích sau này.
3.7. Xác định nhĩm haplogroup bằng HaploGrep2
Với file vcf đầu vào, thu được kết quả đầu ra bao gồm: SampleID – định danh của mẫu
Range – Các vị trí được sắp xếp theo trình tự / kiểu gen trên bộ gen ti thể
Haplogroup – Haplogroup thu được
Cluster – nếu lần truy cập đầu tiên khơng rõ ràng, kết quả của cluster được liệt kê trong cột này
Overall_Rank – điểm của haplogroup (từ 0.5 đến 1) trong khi 0.5 cĩ nghĩa là khơng cĩ SNP nào được tìm thấy, và 1 cĩ nghĩa là khớp tuyệt đối.
Not_found_Polys – false negatives – đột biến được mong đợi trong haplogroup này nhưng khơng tìm thấy
Found_Polys – true positives – các đột biến được tìm thấy của các haplogroup tìm được. Đột biến ngược (Backmutations) cũng được tính, được ký hiệu bởi !
Remaining_Polys – Các biến thể khơng được sử dụng cho phân loại haplogroup này – thể hiện: a) cĩ thể là haplogroup mới, hoặc b) possible sample admixture, hoặc đột biến giả (false positives). Được liệt kê ở đây là hotspot mutations cũng như local private mutations (tìm thấy ở ít nhất một haplogroup khác biệt) hoặc global private mutation (chưa biết trong phát sinh lồi hiện tại), cũng như đột biến khơng đồng nhất (heteroplasmic mutations) hoặc tham chiếu các vị trí giống hệt nhau (thường là các trường hợp dữ liệu dựa trên MicroArray).
AAC_Remaining – các biến thể cịn lại trong cột trước đĩ được chọn - và được đánh dấu như vậy nếu cĩ liên quan đến thay đổi axit amin (Amino Acid Change).
Input_Sample – thơng tin được sử dụng để phân loại
Kết quả tại bảng 3.4 cho thấy haplogroup xác định được ở mtDNA của hai mẫu xương cổ đều là M (CCNN24) và R (CCNN55). M là mtDNA haplogroup phổ biến nhất ở châu Á [63], super-haplogroup M được phân bố trên tồn châu Á, nơi mà nĩ chiếm đến 60% tất cả các dịng mẹ [64].
Ở Việt Nam, haplogroup M được tìm thấy với tần số 37% (52/139) đến 48% (20/42) trong các mẫu của người Việt và chiếm 32% (54/168) của mẫu
người Chăm từ tỉnh Bình Thuận [65, 66]. Vẫn cĩ những cuộc tranh luận xoay quanh nguồn gốc địa lý của Haplogroup M và haplogroup N chị em của nĩ. Cả hai nhánh này được cho rằng là những nhĩm sống sĩt chính đã tiến hố và di cư ra khỏi châu Phi bởi vì tất cả các dịng bản địa được tìm thấy bên ngồi Châu Phi đều thuộc nhĩm haplogroup M hoặc haplogroup N. Các nhà khoa học khơng chắc liệu những đột biến xác định nhĩm gen M và N xảy ra ở Châu Phi trước khi rời khỏi Châu Phi hay ở Châu Á sau khi rời khỏi Châu Phi. Việc xác định nguồn gốc của haplogroup M cịn phức tạp hơn do sự di cư ngược dịng sớm (từ Châu Á sang Châu Phi) của những người mang gen M1 [67].
Haplogroup R là một haplogroup mtDNA phân bố rộng rãi của con người. Haplogroup R cĩ liên quan đến sự xuất hiện của Âu-Á sau khoảng 70.000 năm trước, và phân bố trong các quần thể hiện đại trên khắp thế giới bên ngồi châu Phi cận Sahara [68]. Điều này phù hợp với sự xuất hiện trong quá trình Di cư ven biển ra khỏi Đơng Phi sang Tây, Nam và Đơng Nam Á [69]. Cĩ ý kiến cho rằng dịng tộc ban đầu của các nhĩm M, N và R dọc theo tuyến đường ven biển trong khoảng thời gian khoảng 70.000 đến 60.000 năm trước [70]. Haplogroup R cĩ sự đa dạng và cổ xưa trong cộng đồng dân cư bản địa Nam Á, các bộ lạc ở miền Tây và miền Nam Ấn Độ thể hiện sự đa dạng cao hơn các khu vực khác [68]. Larruga et al. (2017) tìm thấy mtDNA haplogroup R lan rộng đến Âu-Á và Úc từ một khu vực lõi dọc theo bờ biển
3.8. Dựng cây phát sinh chủng loại thơng qua phần mềm MEGA MEGA
Dựa vào các haplogroup đã được xác định trước đĩ, xác định các mẫu mà haplogroup cùng nhánh hoặc thuộc cùng nền văn hĩa và quốc gia thu mẫu, ngồi ra sử dụng thêm mẫu Neanderthal - Vindija_33_25 (FM865410.1), mẫu Denisova8 (KT780370.1), mẫu Denisova2 (KX663333.1), mẫu Denisovan (Homo sp. Altai) khác để so sánh mối liên hệ giữa các mẫu người cổ của các quốc gia khác nhau thuộc cùng một nền văn hĩa và mối quan hệ giữa người Việt cổ và người Việt hiện đại. Thơng tin chi tiết của mẫu trong bảng 3.4.
Bảng 3.4: Thơng tin các mẫu được lựa chọn để xây dựng cây phát sinh lồi
STT Tên mẫu Quốc gia Nguồn Haplogroup
Tuổi (cách ngày này)
Nền văn hĩa 1 Altai Nga Krause J et
al., 2010 >125000
2 Denisova2 Nga Slon et al., 2017
127000- 128000 3 Denisova8 Nga Sawyer et
al., 2015
>50 000 4 Vindija_33_25 Croatia Briggs et
al., 2009
38000
5 RSRS Behar et
al., 2012 6 I0627_N Việt Nam Lipson et
al., 2018
M7b1 3630±35 Thời kỳ đồ đá 7 I1135_N Việt Nam Lipson et
al., 2018
H2a/R0/R 3445±20 Thời kỳ đồ đá 8 I1137_N Việt Nam Lipson et
al., 2018
M7b1a1/ M7b1a1+(16192)
3480±20 Thời kỳ đồ đá 9 I2947_N Việt Nam Lipson et
al., 2018
M7b1a1/H2a2a 3900- 3600
Thời kỳ đồ đá 10 020808_B Việt Nam McColl et
al., 2018 M7b1a1 2343
Thời kỳ đồ đồng 11 020779_B Việt Nam McColl et
al., 2018 M7c1b2b 2336
Thời kỳ đồ đồng 12 CCNM24WG Việt Nam IBT,
VAST H2a2a1 6400
Hậu thời kỳ đồ đá 13 CCNM55WG Việt Nam IBT,
VAST H2a2a1 6400
Hậu thời kỳ đồ đá 14 019719_LN Việt Nam McColl et
al., 2018 M7c2 -
Hậu thời kỳ đồ đá 15 Ede112 Việt Nam Duong et
al., 2018 M21b -
Người hiện đại 16 Ede102 Việt Nam Duong et
al., 2018 M71+151 -
Người hiện đại
al., 2018 hiện đại 18 Tay138 Việt Nam Duong et
al., 2018 M7b1a1a3 -
Người hiện đại 19 Tay135 Việt Nam Duong et
al., 2018 M7b1a1d1 -
Người hiện đại 20 Nung664 Việt Nam Duong et
al., 2018 M61 -
Người hiện đại 21 Nung665 Việt Nam Duong et
al., 2018 M7b1a1 -
Người hiện đại 22 Nung49 Việt Nam Duong et
al., 2018 B4c2c -
Người hiện đại 23 Kinh04 Việt Nam Duong et
al., 2018 M7c1c2 -
Người hiện đại 24 I1859_N Việt Nam Lipson et
al., 2018
M13b1/M13/M13b 3490±25 Thời kỳ đồ đá 25 I10973_N Việt Nam Lipson et
al., 2018
No call 3900- 3600
Thời kỳ đồ đá 26 I2731_N Việt Nam Lipson et
al., 2018
M74b 3430±20 Thời kỳ đồ đá 27 I4458_B Thái Lan Lipson et
al., 2018 M74b2 3200- 3000 Thời kỳ đồ đồng 28 I4011_LN Myanmar Lipson et al., 2018 D4q 3200- 2700 Hậu thời kỳ đồ đá mới - đầu thời kỳ đồ đồng 29 I4012_LN Myanmar Lipson et al., 2018 D4h1c 3200- 2700 Hậu thời kỳ đồ đá mới - đầu thời kỳ đồ đồng 30 I8970_IA Thái Lan Lipson et
al., 2018
M72a 2600- 2400
Đầu thời kỳ đồ sắt 31 I2497_N Việt Nam Lipson et
al., 2018
C7a2/ N/C5b 2100- 1900
Thời kỳ đồ đồng 32 I2448_N Việt Nam Lipson et
al., 2018 M8a2a/H2 2005±15 Thời kỳ đồ đồng 33 017833_LN Việt Nam McColl et al., 2018 M20 4291- 4006 Thời kỳ hậu đồ đá mới 34 018522_IA Thái Lan McColl et
al., 2018 G2b1a 1789±25
Thời kỳ đồ sắt 35 018530_IA Thái Lan McColl et
al., 2018 G2b1a 1756±26
Thời kỳ đồ sắt 36 018531_IA Thái Lan McColl et
al., 2018 G2b1a 1687±24
Thời kỳ đồ sắt 37 TH2A_IA Thái Lan McColl et
al., 2018 G2b1a 1870±30 Thời kỳ đồ sắt 38 019911_HG Malaysia McColl et al., 2018 M21b1a 3872±33 Văn hố Hồ Bình 39 019912_LN Malaysia McColl et al., 2018 M13c 2409±31 Hậu thời kỳ đồ đá 40 020368_HG Lào McColl et al., 2018 M5 7040±38 Văn hố Hồ Bình 41 I8978_LN Thái Lan Lipson et F1f 3500- Hậu thời
al., 2018 3200 kỳ đồ đá mới 42 018521_IA Thái Lan McColl et
al., 2018 F1f 1813 Thời kỳ đồ sắt 43 019743_LN Việt Nam McColl et al., 2018 F1f - Hậu thời kỳ đồ đá mới 44 019744_LN Việt Nam McColl et al., 2018 F1 - Hậu thời kỳ đồ đá mới 45 019880_LN Việt Nam McColl et al., 2018 F1f - Hậu thời kỳ đồ đá mới 46 017661_LN Indonesia McColl et al., 2018 F1a1a 1917±25 Hậu thời kỳ đồ đá mới – thời kỳ đồ sắt 47 020364_LN Lào McColl et al., 2018 F1a1a1 3071 Hậu thời kỳ đồ đá mới – thời kỳ đồ đồng 48 020778_LN Việt Nam McColl et
al., 2018 F1a1a1 2750
Hậu thời kỳ đồ đá mới 49 TH6C_IG Thái Lan McColl et
al., 2018 F1 -
Thời kỳ đồ sắt 50 020777_LN Việt Nam McColl et
al., 2018 F1a1’4 2349
Hậu thời kỳ đồ đá mới 51 020781_B Việt Nam McColl et
al., 2018 F1a 2340
Thời kỳ đồ đồng 52 019533_Filipino Philipin McColl et
al., 2018 F1a4a1 1829±26
Đồ gốm đỏ - Nam đảo 53 TH2B_IA Thái Lan McColl et
al., 2018 F1c1a2 -
Thời kỳ đồ sắt 54 TH2C_IA Thái Lan McColl et
al., 2018 F1c1a2 -
Thời kỳ đồ sắt 55 TH2D_IA Thái Lan McColl et
al., 2018 F1 -
Thời kỳ đồ sắt 56 020796_B Việt Nam McColl et
al., 2018 F1e3 2303
Thời kỳ đồ đồng 57 019554_historic Malaysia McColl et
al., 2018 F3b1a+16093 505 58 019739_LN Việt Nam McColl et
al., 2018 F4b 4381
Hậu thời kỳ đồ đá mới 59 019555_historic Malaysia McColl et
al., 2018 B4b1a2 452 60 017727_HG Lào McColl et al., 2018 N9a6a 2378 Văn hố Hồ Bình 61 019898_HG Lào McColl et al., 2018 N9a6a - Văn hố Hồ Bình 62 019525_HG Malaysia McColl et N9a6a 3551 Văn hố
al., 2018 Hồ Bình 63 018523_IA Thái Lan McColl et
al., 2018 N8 1737
Thời kỳ đồ sắt 64 019534_Filipino Philippines McColl et
al., 2018 B5b1a 1925
Đồ gốm đỏ - Nam đảo 65 I8977_B Thái Lan Lipson et
al., 2018 R/B5 3490±25
Thời kỳ đồ đá 66 014703_IA Thái Lan McColl et
al., 2018 B5a1d 1732
Thời kỳ đồ sắt 67 018519_IA Thái Lan McColl et
al., 2018 B5a1d 1815
Thời kỳ đồ sắt 68 I0626_N Việt Nam Lipson et
al., 2018 R/B5 3490±25
Thời kỳ đồ đá 69 I1680_IA Campuchia Lipson et
al., 2018 B5a1a/ R0/H27 1885±30
Thời kỳ đồ sắt 70 I8974_B Thái Lan Lipson et
al., 2018 R
3200- 3000
Thời kỳ đồ đồng 71 019548_Ma548 Malaysia McColl et
al., 2018 B5a1a 510 72 Thai250 Việt Nam Duong et
al., 2018 C7 73 Nung47 Việt Nam Duong et
al., 2018 M74a 74 Ede736 Việt Nam Duong et
al., 2018 M71+151 75 Giarai100 Việt Nam Duong et
al., 2018 M71+151 76 HMong194 Việt Nam Duong et
al., 2018 F1a1a 77 HMong196 Việt Nam Duong et
al., 2018 F1a1a 78 Kinh01 Việt Nam Duong et
al., 2018 F1g 79 Dao50 Việt Nam Duong et
al., 2018 F3a1 80 Lao91 Lào Zang et al.,
2013 B5b1
81 Jarai04 Campuchia Zang et al.,
Hình 3.17: Cây phát sinh chủng loại của người Việt cổ và người cổ thuộc một số nước trong cùng giai đoạn
HG - hunter gather; EN - early Neolithic; N - Neolithic; LN - Late Neolithic; B - Bronze age; IA – Iron age; Histo - historic (vài trăm năm)
Kết quả từ cây phân loại cho thấy trình tự ty thể của các mẫu được sử dụng để phân tích chia thành năm nhĩm lớn. Nhánh thứ nhất là mẫu Jenny (mẫu ty thể của lồi tinh tinh), phân thành một nhánh tách biệt hồn tồn, cho thấy sự khác biệt rõ rệt giữa người cổ và tinh tinh. Ba mẫu của người Denisovan (mẫu Denisova8, mẫu Denisova2, mẫu Altai) tạo thành một nhánh riêng biệt thứ hai. Nhánh thứ ba và nhánh thứ tư lần lượt thuộc về hai mẫu đơn là Vindija_33_25 (mẫu người Neanderthals) và mẫu tham chiếu RSRS (Hình 3.17B). Và các mẫu người cổ cịn lại thuộc về hai nhánh cĩ quan hệ gần gũi với nhau được đánh dấu bằng hai màu xanh dương (Hình 3.17 A) và đỏ (Hình 3.17C) chi tiết về thơng tin của hai nhánh này cĩ trong bảng 3.5.
Bảng 3.5: Thơng tin các mẫu thuộc hai nhánh xanh dương và đỏ
Nhánh xanh dương Nhánh đỏ
Mẫu Haplogroup Mẫu Haplogroup
I0627_N M7b1 I8978_LN F1f
I1135_N H2a/R0/R 018521_IA F1f
I1137_N M7b1a1/ M7b1a1+(16192) 019743_LN F1f I2947_N M7b1a1/H2a2a 019744_LN F1 020808_B M7b1a1 019880_LN F1f 019719_LN M7c2 017661_LN F1a1a 020779_B M7c1b2b 020364_LN F1a1a1 I1859_N M13b1/M13/M13b 020778_LN F1a1a1
I10973_N No call TH6C_IG F1
I2731_N M74b 020777_LN F1a1’4
I4458_B M74b2 020781_B F1a
I4011_LN D4q 019533_Filipino F1a4a1
I4012_LN D4h1c TH2B_IA F1c1a2
I8970_IA M72a TH2C_IA F1c1a2
I2497_N C7a2/ N/C5b TH2D_IA F1
I2948_B M8a2a/H2 020796_B F1e3
CCNN24_EN M 019554_historic F3b1a+16093
017833_LN M20 019739_LN F4b
018522_IA G2b1a CCNN55 R
018530_IA G2b1a 019555_historic B4b1a2
018531_IA G2b1a 017727_HG N9a6a
TH2A_IA G2b1a 019898_HG N9a6a
019911_HG M21b1a 019525_HG N9a6a 019912_LN M13c 018523_IA N8 020368_HG M5 019534_Filipino B5b1a I8977_B R/B5 014703_IA B5a1d 018519_IA B5a1d I0626_N R/B5 I1680_IA B5a1a/ R0/H27 I8974_B R 019548_Ma548 B5a1a
Cĩ thể thấy các mẫu thuộc nhánh xanh dương chủ yếu thuộc về các sub haplogroup của haplogoup M và G, trong khi các mẫu thuộc nhánh đỏ lại chủ yếu thuộc về các subhaplogoup của F, B, N và R. Và quan trọng là thời đại sinh sống của người cổ của các mẫu này khơng ảnh hưởng đến sự phân nhánh của các mẫu ty thể. Haplogoup G là một nhánh nhỏ của haplogoup M, haplogoup R là nhánh nhỏ của haplogroup N, trong đĩ các sub haplogroup F, B lại là các nhánh con bắt nguồn từ haplogoup R. Điều này lí giải cho sự gần
Hình 3.18: Cây phát sinh chủng loại của người Việt cổ, người cổ thuộc một số nước trong cùng giai đoạn và người Việt hiện đại
HG - Hunter Gather; EN - Early Neolithic; LN – Late Neolithic; N - Neolithic; B - Bronze Age; IA – Iron Age; Historic – Vài trăm năm
Kết quả phân tích khơng chỉ đưa ra giả thuyết về mối liên hệ của người Việt cổ và người Việt hiện đại mà là giả thuyết về mối liên hệ giữa các dân tộc khác của người Việt hiện đại với các người cổ thuộc một số nước trong khu vực Đơng Nam Á. Với sự mở rộng mẫu này, hai mẫu người Việt cổ đã phân tách rõ ràng về hai nhánh nhỏ thuộc cùng một nhĩm lớn hơn.
Mẫu Nung665, Tay 135, Tay138 cĩ mối liên hệ gần gũi với nhau và mối liên hệ này thể hiện khi haplogoup của các nhĩm này lần lượt là M7b1a1, M7b1a1a3, M7b1a1d1. Ngồi ra, ba mẫu này thuộc cùng một nhĩm nhỏ với ba mẫu khác là I0627 (M7b1), I1135 (H2a/R0/R), I2947 (M7b1a1/H2a2a) và 020808 (M7b1a1) tương ứng với các mẫu của người Việt cổ thời kỳ đồ đá và thời kỳ đồ đồng. Nhĩm nhỏ tiếp theo được tạo thành bởi mẫu Thai249, Kinh04 và 020779 với các haplogroup lần lượt là M7c1, M7c1c2, M7c1b2b. Nhĩm nhỏ cĩ quan hệ gần với nhĩm này gồm các mẫu I2497 (M7b1a1/H2a2a), Thai250 (C7), I2948 (M8a2a/H2) và CCN24 (M). haplogroup C là con cháu của haplogoup M, đây là lí do vì sao những mẫu mtDNA này lại cĩ mối liên hệ gần như vậy. Một điểm đáng chú ý khác là các mẫu Ede và Giarai cho thấy cĩ quan hệ khá gần gũi với nhau. Minh chứng là Ede112 (M21b), Giarai124 (M21b) thuộc cùng một nhĩm nhỏ, Ede102, Ede736 và Giarai100 nằm trong một nhĩm nhỏ và cùng cĩ haplogoup là M71+151. Mặt khác, một giả thuyết nữa được chỉ ra khi một dân tộc khác cĩ quan hệ di truyền gần gũi với người Việt hậu thời kỳ đồ đá mới – đầu thời kỳ đồ đồng là Hmong với hai mẫu Hmong194, Hmong196 và haplogroup của các mẫu này đều thuộc F1a hoặc các subhaplogroup của F1a. Bên cạnh đĩ, mẫu người Kinh (Kinh01 – F1g) cĩ liên hệ di truyền gần gũi với mẫu người Việt cổ thời kỳ đồ đồng (020796 – F1e3). Cũng là các mẫu thuộc haplogroup F, mẫu Dao50 (F2e), Dao51 (F3a1) và 019739 (F4a) – mẫu người Việt cổ hậu thời kỳ đồ đá mới thể hiện quan hệ di truyền gần gũi. Một điểm đáng chú ý khác, một mẫu khác của dân tộc Nùng (Nung49 – B4c2c) lại cĩ mối liên quan với một mẫu người cổ đến từ Malaysia (01955 – B4b1a2) mới xuất hiện cách đây vài trăm năm.
Những kết quả này bước đầu chứng minh cho giả thuyết các dân tộc Việt Nam hiện đại khơng chỉ cĩ mối liên hệ di truyền gần gũi với nhau mà cịn cĩ mối liên hệ di truyền với người Việt cổ thuộc hậu thời kỳ đồ đá mới -
đầu thời kỳ đồ đồng và thời kỳ đồ đồng. Bên cạnh đĩ, những kết quả phân tích phả hệ này thể hiện sự tương đồng với một số phân tích trong các kết quả của một số nhĩm nghiên cứu khác. Cụ thể, các cá thể người cổ tại Mán Bạc 4.000 năm tuổi (hậu thời kỳ đồ đá mới) từ miền Bắc Việt Nam chia sẻ mối quan hệ gần gũi với sEastAsia_LN (hậu thời kỳ đồ đá mới) ven biển (Xitoucun, Tanshishan), họ hàng với cả người Ami – người Nam Đảo ngày