L Ư U T H Ủ Y T IÊ N BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Lưu Thủy Tiên S IN H H Ọ C T H Ự C N G H IỆ M NGHIÊN CỨU CẤU TRÚC DI TRUYỀN QUẦN[.]
1 of 98 BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ LƯU THỦY TIÊN Lưu Thủy Tiên SINH HỌC THỰC NGHIỆM NGHIÊN CỨU CẤU TRÚC DI TRUYỀN QUẦN THỂ NGƯỜI Ê ĐÊ, VIỆT NAM VÀ MỐI QUAN HỆ VỚI CÁC QUẦN THỂ KHÁC CÙNG KHU VỰC ĐÔNG NAM Á VÀ CÙNG NGỮ HỆ NAM ĐẢO LUẬN VĂN THẠC SĨ NGÀNH SINH HỌC 2023 Hà Nội – 2023 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chun ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thông tin document, khoa luan, tieu luan, 123 of 98 BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Lưu Thủy Tiên NGHIÊN CỨU CẤU TRÚC DI TRUYỀN QUẦN THỂ NGƯỜI Ê ĐÊ, VIỆT NAM VÀ MỐI QUAN HỆ VỚI CÁC QUẦN THỂ KHÁC CÙNG KHU VỰC ĐÔNG NAM Á VÀ CÙNG NGỮ HỆ NAM ĐẢO Chuyên ngành : Sinh học thực nghiệm Mã số: 8420114 LUẬN VĂN THẠC SĨ NGÀNH SINH HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC : GS.TS Chu Hoàng Hà Hà Nội - 2023 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Công ngh thông tin document, khoa luan, tieu luan, 123 of 98 LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu luận văn công trình nghiên cứu tơi dựa tài liệu, số liệu tơi tự tìm hiểu nghiên cứu Chính vậy, kết nghiên cứu đảm bảo trung thực khách quan Đồng thời, kết chưa xuất nghiên cứu Các số liệu, kết nêu luận văn trung thực sai tơi hồn chịu trách nhiệm trước phát luật Tác giả Lưu Thủy Tiên Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123 of 98 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123 of 98 LỜI CẢM ƠN Đầu tiên xin gửi lời cảm ơn đến thầy hướng dẫn GS.TS Chu Hoàng Hà, khơng có hỗ trợ tận tình suốt q trình tơi khơng thể hồn thành luận văn Tôi xin cảm ơn nhân viên lãnh đạo Trung tâm Giám định DNA Phịng thí nghiệm trọng điểm Công nghệ Gen, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học Công nghệ Việt Nam, giúp đỡ tơi có thêm nhiều kiến thức kinh nghiệm bước tiến hành luận văn Bên cạnh đó, tơi xin cảm ơn Viện Hàn lâm Khoa học Công nghệ Việt Nam thành viên đề tài “Nghiên cứu giải trình tự gen mẫu xương khảo cổ Việt Nam nhằm cung cấp thông tin di truyền cho nghiên cứu đa dạng sinh học người khảo cổ học”, mã số đề tài: DL0000.08/20-22 giúp đạt kết luận văn Tiếp đến xin gửi lời cảm ơn đến ban Lãnh đạo, phòng Đào tạo, phòng chức Học viện Khoa học Cơng nghệ để luận văn hồn thành Cuối cùng, xin chân thành cảm ơn nhận ủng hộ, giúp đỡ từ gia đình bạn bè suốt trình làm luận văn Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123 of 98 MỤC LỤC MỞ ĐẦU Chương TỔNG QUAN NGHIÊN CỨU 1.1 Người Ê Đê Việt Nam 1.1.1 Các dân tộc Việt Nam 1.1.2 Người Ê Đê – lịch sử văn hóa 1.2 Nghiên cứu cấu trúc di truyền quần thể sử dụng thị STR 1.2.1 Chỉ thị STR 1.2.2 Cấu trúc di truyền quần thể 12 1.2.3 Phương pháp phân tích cấu trúc di truyền quần thể 13 Chương ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 17 2.1 ĐỐI TƯỢNG NGHIÊN CỨU 17 2.2 PHƯƠNG PHÁP NGHIÊN CỨU 18 2.2.1 Locus STR sử dụng 18 2.2.2 Phân tích mối quan hệ di truyền quần thể 18 2.2.2.1 Tính khoảng cách di truyền Fst đơi 18 2.2.2.2 Phân tích cấu trúc quần thể 19 2.2.3 Xây dựng phân loại phương pháp Neighbor-joining 20 Chương KẾT QUẢ VÀ THẢO LUẬN 22 3.1 Phân tích cấu trúc di truyền dựa hai hệ dòng quần thể người Ê Đê 22 3.1.1 Phân tích số khoảng cách di truyền Fst 22 3.1.2 Kết phân tích thành phần 25 3.1.3 Phân nhóm quần thể STRUCTURE 28 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123 of 98 3.2 Phân tích cấu trúc di truyền theo khu vực phân bố quần thể người Ê Đê 30 3.2.1 Phân tích số khoảng cách di truyền Fst 31 3.2.3 Phân nhóm quần thể STRUCTURE 36 3.2.4 Phân tích kết xây dựng phân loại 38 KẾT LUẬN VÀ KIẾN NGHỊ 42 PHỤ LỤC 47 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chun ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thông tin document, khoa luan, tieu luan, 123 of 98 DANH MỤC CÁC KÝ HIỆU, CHỮ CÁI VIẾT TẮT STT Tên viết tắt Tên đầy đủ Nghĩa tiếng việt CODIS Combined DNA Index System Hệ thống Chỉ số DNA Kết hợp DNA Deoxyribonucleic acid Deoxyribonucleic acid MP Match probability Chỉ số khả trùng hợp ngẫu nhiên NST Nhiễm sắc thể NJ Neighbor-joining PCA Principal components analysis Phân tích thành phần PCR Polymerase chain reaction Phản ứng khuếch đại luân nhiệt PD Power of discrimation Chỉ số phân biệt PE Power of exclusion Chỉ số loại trừ 10 PIC Polymorphic information content Chỉ số đa hình 11 STR Short tandem repeats Các đoạn lặp lại song song ngắn Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123 of 98 DANH MỤC BẢNG Bảng 1 Danh sách locus có Bộ khuếch đại VeriFiler Express PCR 10 Bảng Các quần thể tham chiếu 18 Bảng Bốn nhóm người Ê Đê chia theo địa bàn cư trú 31 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thông tin document, khoa luan, tieu luan, 123 10 of 98 DANH MỤC HÌNH Hình 1.1 Bản đồ dân tộc Việt Nam [1] Hình 1.2 13 locus STR cốt lõi CODIS với vị trí tương ứng NST [16] Hình 3.1 Biểu đồ heatmap giá trị Fst đơi nhóm quần thể Ê Đê với quần thể tham chiếu 24 Hình 3.2 Biểu đồ scree trực quan tỉ lệ thành phần 25 Hình 3.3 Chất lượng biểu diễn biến sơ đồ nhân tố (cos2) 26 Hình 3.4 Kết phân tích PCA hai nhóm Nie Mlo với hai thành phần 27 Hình 3.5 Kết trung bình giá trị L(K) với 10 lần lặp lại K 28 Hình 3.6 Kết biểu cho A K từ đến 10, B K=5 29 Hình 3.7 Biểu đồ heatmap giá trị Fst đôi nhóm quần thể Ê Đê với quần thể tham chiếu Error! Bookmark not defined Hình 3.8 Biểu đồ scree trực quan tỉ lệ thành phần 33 Hình 3.9 Chất lượng biểu diễn biến sơ đồ nhân tố (cos2) 34 Hình 3.10 Phân tích PCA nhóm EDE1, EDE2, EDE3 EDE4 với hai thành phần đầu 35 Hình 3.11 Giá trị trung bình L(K) với 10 lần lặp lại K 36 Hình 3.12 Kết biểu cho A.K từ đến 10 B K=5 37 Hình 3.13 Cây phân loại quần thể nghiên cứu với quần thể thuộc ngữ hệ 39 Hình 3.14 Cây Neighbor-Joining quần thể nghiên cứu với quần thể thuộc Nam Đảo 40 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123 47 of 98 37 A B Hình 12 Kết biểu cho A.K từ đến 10 B K=5 Mỗi cá thể đại diện cột chia thành phân đoạn có kích thước màu sắc tương ứng với tỷ lệ cụm cụ thể Các quần thể phân cách vạch đen Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thông tin document, khoa luan, tieu luan, 123 48 of 98 38 Kết STRUCTURE ủng hộ tính khác biệt quần thể thuộc ngữ hệ Nam Đảo cho thấy khác biệt nhỏ di truyền bốn nhóm Ê Đê (Hình 3.11) Ở K=6, cụm màu xanh nước biển xuât hầu hết quần thể, chiểm tỷ trọng cao nhóm Ê Đê (~70%), tiếp đến nhóm quần thể Đông Nam Á (10-30%) thấp nhóm quần thể Trung Quốc Nam Đảo Nhóm quần thể Nam Đảo cho thấy phân tách rõ rệt mặt di truyền với cụm màu vàng cam (biểu cao quần thể Ami Paiwan) cụm màu tím đậm (biểu cao quần thể Atayal Bunun) Cụm màu hồng đậm chiếm tỉ lệ cao quần thể Trung Quốc phân bố rải rác nhóm quần thể khác Với bốn nhóm người Ê Đê, quần thể có cấu trúc di truyền tương tự với cụm màu xanh dương chiếm ưu ta quan sát khác biệt tỉ lệ nhóm Ở quần thể EDE1 EDE2 xuất tỉ lệ nhỏ cụm màu hồng nhạt hai quần thể cịn lại gần khơng có Một điều thú vị quần thể EDE2 nhóm có tỷ lệ cụm xanh nước biển thấp tỉ lệ cụm màu cam cao so với nhóm cịn lại Cụm quan sát nhiều nhóm quần thể Ami Paiwan Đây kết đáng ý, phân tích mtDNA SNPs cho thấy nhóm Ami cịn lưu giữ nguồn gen từ nhóm săn bắt hái lượm địa khu vực Đông Nam Á-Thái Bình Dương Do đó, nhóm EDE2 cịn giữ nguồn gen hệ gen Tuy nhiên, cần có thêm nghiên cứu mở rộng hệ gen để khẳng định thêm quan sát Ngoài ra, quần thể gần khơng xuất cụm màu tím, đặc trưng nhóm Atayal Bunun Tương tự, quần thể EDE4 cho thấy tỷ lệ nhỏ cụm màu tím Mặt khác hai nhóm EDE1 EDE3 cho thấy tỷ lệ hai cụm vàng cam tím đậm tương đương 3.2.4 Phân tích kết xây dựng phân loại Trong tiến trình lịch sử hướng di cư quần thể gốc Đài Loan, xuất quần thể Philippine Indonesia đóng vai trị quan trọng hình thành phát triển quần thể người Ê Đê Ngồi ra, nhóm quần thể nước ảnh hưởng đến phát triển quần thể Tuy nhiên, khơng có liệu kiểu gen locus STR nhiều Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123 49 of 98 39 quần thể Nam Đảo Philippine, Indonesia hay quần thể Việt Nam Khmer, H’mong, Thái, Tày nên khơng thể phân tích hay so sánh sâu mối quan hệ họ quần thể người Ê Đê Phương pháp dựng phân loại Neighbor-joining dựa số khoảng cách di truyền Nei [42] lựa chọn để đánh giá mối quan hệ quần thể nghiên cứu với nhiều quần thể khác liệu đầu vào yêu cầu bảng tần số alen Hình 13 Cây phân loại quần thể nghiên cứu với quần thể thuộc ngữ hệ Với phân loại đầu tiên, quần thể nghiên cứu so sánh với nhóm quần thể thuộc ngữ hệ Việt Nam Nam Đảo, Nam Á, Hmong – Dao, Thái – Kadai Hán Tạng Các nhóm quần thể Đơng Á Đơng Nam Á thuộc nhánh lớn với đủ ngữ hệ Trong nghiên cứu trước, quần thể hai khu vực cho thấy gần gũi mặt di truyền [49] Trong đó, ba nhóm Thái Kadai, Nam Á Nam Đảo Đông Nam Á (trừ Philippine) phân thành nhánh có trao đổi nguồn gen khứ, quan sát nghiên cứu McColl cộng sự, 2018 [50] Mặt Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chun ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thông tin document, khoa luan, tieu luan, 123 50 of 98 40 khác, nhóm quần thể Nam Đảo phân tách thành hai nhóm khác với nhóm quần thể Đài Loan Polynesia thuộc nhánh Điều cho thấy bị ảnh hưởng vị trí địa lý, nhóm Nam Đảo cho thấy liên kết di truyền Hình 14 Cây Neighbor-Joining quần thể nghiên cứu với quần thể thuộc Nam Đảo Để quan sát rõ mối quan hệ di truyền quần thể thuộc ngữ hệ Nam Đảo, phân loại gồm nhóm Ê Đê 13 quần thể thuộc ngữ hệ xây dựng Các quần thể Nam Đảo khu vực Polynesia gồm Madagascar, Tonga, Samoa, Marquesan nằm phân tách hẳn với quần thể khác với số bootstrap 96.7% Quan sát thấy nhiều nghiên cứu trước Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Công ngh thông tin document, khoa luan, tieu luan, 123 51 of 98 41 [37, 46] Các nhóm quần thể Nam Đảo châu Á chia thành hai nhóm lớn nhóm quần thể Đài Loan, Philippine nhóm quần thể khác Đơng Nam Á, bao gồm bốn nhóm Ê Đê Nhiều nghiên cứu dựa liệu phân tử khác quần thể Philippine có kế thừa mặt di truyền nhóm quần thể gốc Nam Đảo Đài Loan, ngược lại với nhóm quần thể Nam Đảo Đơng Nam Á chủ yếu kế thừa ngôn ngữ [51] Mặt khác, bốn nhóm Ê Đê thể mối quan hệ di truyền gần gũi với người Malaysia Indonesia, phản ánh mối liên hệ địa lý lịch sử [52] tương tự với phân tích Pham cộng (2022) [27] Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chun ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thông tin document, khoa luan, tieu luan, 123 52 of 98 42 KẾT LUẬN VÀ KIẾN NGHỊ KẾT LUẬN Hai nhóm Nie Mlo đồng mặt di truyền với pha trộn nguồn gen nhóm khác Hai nhóm quần thể gần gũi với nhóm quần thể Đơng Nam Á nhóm quần thể ngữ hệ Nam Đảo Điều cho thấy hệ dịng khơng có ảnh hưởng đến cấu trúc di truyền quần thể người Ê Đê Mặt khác, bốn nhóm EDE1, EDE2, EDE3 EDE4 tương đồng cấu trúc di truyền quan sát khác biệt nhỏ nhóm Kết cho thấy ảnh hưởng vị trí địa lý đến cấu trúc di truyền quần thể người Ngồi ra, bốn nhóm quần thể người Ê Đê phân nhánh với nhóm Nam Đảo Malaysia Indonesia, cho thấy mối quan hệ di truyền gần gũi với hai nhóm KIẾN NGHỊ Mở rộng nghiên cứu di truyền nhóm dân tộc có tương đồng văn hóa, lịch sử hay ngơn ngữ với người Ê Đê quần thể người Giarai, Bana, Cho-ru, Chăm, Mnơng, Việc phân tích mối tương quan di truyền họ bổ sung thêm chứng lịch sử phát triển người Ê Đê Mở rộng nghiên cứu di truyền với thị có tính bảo thủ cao mtDNA hay NST Y để phân tích xuất nguồn gốc người Ê Đê Việt Nam Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Công ngh thông tin document, khoa luan, tieu luan, 123 53 of 98 43 DANH MỤC TÀI LIỆU THAM KHẢO 10 11 12 13 14 Bộ giáo dục Đào Tạo, Atlat Địa lý Việt Nam, p 16 Tổng cục thống kê, Tổng điều tra dân số nhà năm 2019 Vũ Đình Long (1997) Gia đình hôn nhân truyền thống dân tộc Malayô - Polynexia Trường Sơn - Tây Nguyên NXB Khoa học Xã Hội Đặng Minh Tâm (2018) Tên họ người Ê Đê – Nguồn gốc, cấu tạo cách sử dụng HNUE J Sci 63:86–96 https://doi.org/10.18173/23541069.2018-0031 Đặng Minh Tâm (2019) Tên riêng người Ê Đê Tây Nguyên Trường Đại học Sư Phạm Hà Nội Tilanus MGJ (2006) Short tandem repeat markers in diagnostics: What’s in a repeat? Leukemia 20:1353–1355 https://doi.org/10.1038/sj.leu.2404273 Butler JM (2004) Short tandem repeat analysis for human identity testing Curr Protoc Hum Genet Chapter 14:1–22 https://doi.org/10.1002/0471142905.hg1408s41 Sawaya S, Bagshaw A, Buschiazzo E, et al (2013) Microsatellite Tandem Repeats Are Abundant in Human Promoters and Are Associated with Regulatory Elements PLoS One 8: https://doi.org/10.1371/journal.pone.0054710 Chen HY, Ma SL, Huang W, et al (2016) The mechanism of transactivation regulation due to polymorphic short tandem repeats (STRs) using IGF1 promoter as a model Sci Rep 6:1–10 https://doi.org/10.1038/srep38225 Chakraborty R, Kimmel M, Stivers DN, et al (1997) Relative mutation rates at di-, tri-, and tetranucleotide microsatellite loci Proc Natl Acad Sci U S A 94: https://doi.org/10.1073/pnas.94.3.1041 Kornberg A, Bertsch Ll, Jackson Jf, Khorana Hg (1964) enzymatic synthesis of deoxyribonucleic acid, xvi oligonucleotides as templates and the mechanism of their replication Proc Natl Acad Sci U S A 51:315– 323 https://doi.org/10.1073/pnas.51.2.315 Huang QY, Xu FH, Shen H, et al (2002) Mutation patterns at dinucleotide microsatellite loci in humans Am J Hum Genet 70:625–634 https://doi.org/10.1086/338997 Nadir E, Margalit H, Gallily T, Ben-Sasson SA (1996) Microsatellite spreading in the human genome: Evolutionary mechanisms and structural implications Proc Natl Acad Sci U S A 93:6470–6475 https://doi.org/10.1073/pnas.93.13.6470 Butler JM (2006) Genetics and genomics of core short tandem repeat loci used in human identity testing J Forensic Sci 51:253–265 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thông tin document, khoa luan, tieu luan, 123 54 of 98 44 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 https://doi.org/10.1111/j.1556-4029.2006.00046.x Panneerchelvam S, Norazmi MN (2003) Forensic DNA profiling and database Malaysian J Med Sci 10:20–26 NIST 13 CODIS Core STR Loci https://www.nist.gov/ Accessed 12 Jun 2023 Thermo Fisher Scientific, VeriFiler Express PCR Amplification Kit User Guide 138 Slatkin M (1987) Quantitative genetics of heterochrony Evolution (N Y) 41:799–811 https://doi.org/10.1111/j.1558-5646.1987.tb05854.x Kidd KK, Pakstis AJ, Speed WC, et al (2006) Developing a SNP panel for forensic identification of individuals Forensic Sci Int 164:20–32 https://doi.org/10.1016/j.forsciint.2005.11.017 Kidd KK, Speed WC, Pakstis AJ, et al (2014) Progress toward an efficient panel of SNPs for ancestry inference Forensic Sci Int Genet 10:23–32 https://doi.org/https://doi.org/10.1016/j.fsigen.2014.01.002 Wright S (1965) The interpretation of population structure by F‐statistics with special regard to systems of mating Evolution (N Y) 19:395–420 https://doi.org/10.1111/j.1558-5646.1965.tb01731.x Wright S (1951) The genetical structure of populations Ann Eugen 15:323–354 https://doi.org/10.2307/2407273 Paschou P, Ziv E, Burchard EG, et al (2007) PCA-correlated SNPs for structure identification in worldwide human populations PLoS Genet 3:1672–1686 https://doi.org/10.1371/journal.pgen.0030160 Elhaik E (2022) Principal Component Analyses (PCA)-based findings in population genetic studies are highly biased and must be reevaluated Nature Publishing Group UK Evanno G, Regnaut S, Goudet J (2005) Detecting the number of clusters of individuals using the software STRUCTURE: A simulation study Mol Ecol 14:2611–2620 https://doi.org/10.1111/j.1365-294X.2005.02553.x Macholdt E, Arias L, Duong NT, et al (2020) The paternal and maternal genetic history of Vietnamese populations Eur J Hum Genet 28:636–645 https://doi.org/10.1038/s41431-019-0557-4 Dung Pham P, Luc Hoang T, Tra Le K, et al (2022) The first data of allele frequencies for 23 autosomal STRs in the Ede ethnic group in Vietnam Leg Med 57:102072 https://doi.org/10.1016/j.legalmed.2022.102072 Tran LH, Chu PTM, Nguyen TH, et al (2022) Genetic structure and population connection of two Bouyei populations in northern Vietnam based on short tandem repeat analysis Am J Hum Biol 34:1–10 https://doi.org/10.1002/ajhb.23702 Kutanan W, Kampuansai J, Colonna V, et al (2011) Genetic affinity and Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thông tin document, khoa luan, tieu luan, 123 55 of 98 45 30 31 32 33 34 35 36 37 38 39 40 admixture of northern Thai people along their migration route in northern Thailand: Evidence from autosomal STR loci J Hum Genet 56:130–137 https://doi.org/10.1038/jhg.2010.135 Srikummool M, Srithawong S, Muisuk K, et al (2022) Forensic and genetic characterizations of diverse southern Thai populations based on 15 autosomal STRs Sci Rep 12:1–11 https://doi.org/10.1038/s41598021-04646-1 Srithawong S, Muisuk K, Srikummool M, et al (2020) Genetic structure of the ethnic Lao groups from mainland Southeast Asia revealed by forensic microsatellites Ann Hum Genet 84:357–369 https://doi.org/10.1111/ahg.12379 Fan H, Du Z, Wang F, et al (2021) The forensic landscape and the population genetic analyses of Hainan Li based on massively parallel sequencing DNA profiling Int J Legal Med 135: https://doi.org/10.1007/s00414-021-02590-3 Tran HL, Nguyen HT, Pham TT, et al (2019) Allele frequencies for 22 autosomal STRs in the Kinh population in Vietnam Int J Legal Med 133:1761–1762 https://doi.org/10.1007/s00414-018-01996-w Kraaijenbrink T, Zuniga S, Su B, et al (2008) Allele frequency distribution of 21 forensic autosomal STRs in populations from Yunnan, China Forensic Sci Int Genet 3: https://doi.org/10.1016/j.fsigen.2008.02.007 Mirabal S, Cadenas AM, Garcia-Bertrand R, Herrera RJ (2013) Ascertaining the role of Taiwan as a source for the Austronesian expansion Am J Phys Anthropol 150:551–564 https://doi.org/10.1002/ajpa.22226 Hakim HM, Khan HO, Ismail SA, et al (2020) Forensic parameters and ancestral fractions in the Kedayan population inferred using 21 autosomal STR loci Meta Gene 25: https://doi.org/10.1016/j.mgene.2020.100741 Palencia-Madrid L, Baeta M, Villaescusa P, et al (2019) The Marquesans at the fringes of the Austronesian expansion Eur J Hum Genet 27:801– 810 https://doi.org/10.1038/s41431-019-0336-2 Hadley Wickham (2009) ggplot2 - Elegant Graphics for Data Analysis Springer New York, NY Lê S, Josse J, Husson F (2008) FactoMineR: An R package for multivariate analysis J Stat Softw 25:1–18 https://doi.org/10.18637/jss.v025.i01 Hubisz MJ, Falush D, Stephens M, Pritchard JK (2009) Inferring weak population structure with the assistance of sample group information HUBISZ - 2009 - Molecular Ecology Resources - Wiley Online Library Mol Ecol Resour 9:1322–1332 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123 56 of 98 46 41 42 43 44 45 46 47 48 49 50 51 52 Kopelman NM, Mayzel J, Jakobsson M, et al (2015) Clumpak: a program for identifying clustering modes and packaging population structure inferences across K Mol Ecol Resour 15:1179–1191 https://doi.org/https://doi.org/10.1111/1755-0998.12387 Nei M, Chesser Rk (1983) Estimation of fixation indices and gene diversities Ann Hum Genet 47:253–259 https://doi.org/https://doi.org/10.1111/j.1469-1809.1983.tb00993.x Shepard EM, Chow RA, Suafo’a E, et al (2005) Autosomal STR variation in five Austronesian populations Hum Biol 77:825–851 https://doi.org/10.1353/hub.2006.0019 De Ungria MCA, Roby RK, Tabbada KA, et al (2005) Allele frequencies of 19 STR loci in a Philippine population generated using AmpFlSTR multiplex and ALF singleplex systems Forensic Sci Int 152:281–284 https://doi.org/10.1016/j.forsciint.2004.09.125 Seah LH, Jeevan NH, Othman MI, et al (2003) STR data for the AmpFlSTR identifiler loci in three ethnic groups (Malay, Chinese, Indian) of the Malaysian population Forensic Sci Int 138:134–137 https://doi.org/10.1016/j.forsciint.2003.09.005 Regueiro M, Mirabal S, Lacau H, et al (2008) Austronesian genetic signature in East African Madagascar and Polynesia J Hum Genet 53:106–120 https://doi.org/10.1007/s10038-007-0224-4 Trịnh TT (2019) Nghiên cứu đặc trưng tần suất alen hệ nhận dạng STR (AmpFISTR® identifiler® plus kit) số tộc người Việt Nam để ứng dụng giám định ADN Đại học Khoa học Tự Nhiên - Đại học Quốc Gia Hà Nội Porras-Hurtado L, Ruiz Y, Santos C, et al (2013) An overview of STRUCTURE: Applications, parameter settings, and supporting software Front Genet 4:1–13 https://doi.org/10.3389/fgene.2013.00098 The HUGO Pan-Asian SNP Consortium (2013) Mapping Human Genetic Diversity in Asia Science (80- ) 2556 Mccoll H, Racimo F, Vinner L, et al (2018) The prehistoric peopling of Southeast Asia Hum Genomics 92:88–92 Soares PA, Trejaut JA, Rito T, et al (2016) Resolving the ancestry of Austronesian-speaking populations Hum Genet 135:309–326 https://doi.org/10.1007/s00439-015-1620-z Bellwood P (1997) Prehistory of the Indo-Malaysian Archipelago ANU Press Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Công ngh thông tin document, khoa luan, tieu luan, 123 57 of 98 47 PHỤ LỤC Bảng 1: Chỉ số khoảng cách di truyền Fst hai quần thể Nie, Mlo quần thể tham chiếu KHM TIB NU HAN YI AMI PAI ATA BUN NIE MLO BRU MAR KHM MON MON KINH KINH LAT LAT LUE LUE LAO LAO BT BT LI LI BY_LC BY_LC BY_HG BY_HG + + - + + - - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + - + + + + + + + + + + + + + + + + + - + + + + + + + + + + + + + + + - - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + - + + + + + - + + + + + - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 0.007 16 0.006 0.006 09 86 -0.00 0.004 0.004 76 45 87 0.008 0.007 0.006 0.011 61 27 07 0.007 0.012 0.007 0.007 0.007 68 24 71 86 0.003 0.005 0.003 0.002 0.001 0.005 14 79 24 36 52 22 0.002 0.006 0.002 -0.00 0.002 0.004 -0.00 35 86 122 14 91 23 0.011 0.011 0.008 0.007 0.011 0.008 0.006 0.004 79 93 01 49 74 33 59 31 0.011 0.015 0.011 0.008 0.007 0.015 0.003 0.010 0.013 19 02 13 27 45 11 12 44 11 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Công ngh thông tin document, khoa luan, tieu luan, 123doc, Tai lieu57 of 98 58 of 98 48 TIB NU HAN YI AMI 0.020 0.025 0.009 0.023 0.024 0.018 0.023 0.022 0.018 0.027 91 86 79 99 04 25 18 0.026 0.025 0.022 0.023 0.024 0.027 0.021 0.020 0.015 0.027 0.017 96 64 98 47 23 13 38 93 71 97 + + + + + + + + + + + + + + + + + + + + + - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + - + + + + + 0.007 0.011 0.007 0.010 0.011 0.010 0.007 0.007 0.006 0.015 0.010 0.014 35 25 15 31 97 77 24 19 69 51 65 87 0.008 0.011 0.007 0.007 0.010 0.008 0.002 0.003 0.005 0.013 0.011 0.009 -0.00 17 81 42 38 74 75 93 24 54 39 44 03 017 0.014 0.012 0.014 0.010 0.019 0.018 0.012 0.009 0.005 0.024 0.029 0.024 0.008 0.009 27 31 15 71 05 32 52 81 31 25 36 88 31 PAI 0.017 0.024 0.020 0.014 0.023 0.027 0.017 0.013 0.016 0.024 0.036 0.035 0.017 0.014 0.009 44 87 26 02 41 94 02 17 31 15 01 69 77 22 66 ATA 0.030 0.040 0.038 0.032 0.045 0.039 0.038 0.028 0.039 0.048 0.055 0.063 0.031 0.034 0.038 0.023 56 46 57 11 73 18 04 27 49 76 16 22 09 57 BUN NIE MLO BRU MAR 0.024 0.034 0.028 0.023 0.038 0.032 0.031 0.023 0.029 0.032 0.046 0.044 0.026 0.025 0.019 0.016 0.019 92 34 24 58 36 68 64 88 87 53 72 19 82 87 19 0.009 0.011 0.007 0.006 0.004 0.010 0.003 0.005 0.009 0.006 0.020 0.022 0.013 0.009 0.016 0.021 0.043 0.033 09 67 14 23 62 01 14 53 51 15 61 62 08 27 54 21 33 43 0.009 0.011 0.008 0.005 0.005 0.011 0.001 0.003 0.010 0.008 0.023 0.028 0.015 0.008 0.016 0.019 0.039 0.034 0.000 61 38 43 36 88 75 56 82 42 26 37 23 79 27 06 24 05 69 0.020 0.013 0.016 0.020 0.023 0.022 0.019 0.019 0.015 0.029 0.032 0.033 0.016 0.016 0.012 0.025 0.046 0.029 0.022 0.023 26 04 38 81 65 87 44 22 73 48 22 21 21 85 56 54 51 71 21 0.045 0.046 0.037 0.044 0.049 0.043 0.041 0.040 0.040 0.046 0.048 0.059 0.041 0.035 0.039 0.037 0.060 0.048 0.044 0.042 0.049 68 94 91 34 43 25 86 79 59 92 55 75 45 83 72 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Cơng ngh thơng tin document, khoa luan, tieu luan, 123doc, Tai lieu58 of 98 29 81 75 59 of 98 49 Bảng Chỉ số khoảng cách di truyền Fst bốn quần thể EDE1, EDE2, EDE3, EDE4 quần thể tham chiếu BY_HG BY_LC LI BT LAO LUE LAT KINH MON KHM TIB NU HAN YI AMI PAI ATA BUN EDe1 EDe2 EDe3 Ede4 Bru Mar + + - + + - - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + - - + + + + + + + + + + + + + + + + 0.00 445 0.00 487 + + - - + + + + + + + + + + + + + + + + BY _H G BY _L C LI 0.00 716 0.00 0.00 609 686 BT 0.00 076 LA O 0.00 861 0.01 0.00 727 0.00 607 + - - + + + + + + + + + + + - + + + + LU E 0.00 768 0.01 224 0.00 771 0.00 786 0.00 74 + + + + + + + + + + + + + + + + + + LA T 0.00 314 0.00 579 0.00 324 0.00 236 0.00 152 0.00 522 - + + + + + - + + + + + - + + + + KI NH 0.00 29 0.00 635 0.00 286 0.00 214 0.00 491 0.00 + + + + + + + + + + + - + + + + MO 0.01 0.01 0.00 0.00 0.01 0.00 0.00 0.00 N 179 193 801 749 174 833 659 431 + + + + + + + + + + + + + + + 0.00 122 23 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Công ngh thông tin document, khoa luan, tieu luan, 123doc, Tai lieu59 of 98 60 of 98 50 KH 0.01 0.01 0.01 0.00 0.00 0.01 0.00 0.01 0.01 M 119 502 113 827 745 511 312 044 311 0.02 0.02 0.00 0.02 0.02 0.01 0.02 0.02 0.01 0.02 091 586 979 399 47 89 304 225 81 718 NU 0.02 696 0.02 564 0.02 298 0.02 347 0.02 423 0.02 713 0.02 138 0.02 093 0.01 571 HA N 0.00 735 0.01 125 0.00 715 0.01 031 0.01 197 0.01 077 0.00 724 0.00 719 YI 0.00 817 0.01 181 0.00 742 0.00 738 0.01 074 0.00 875 0.00 293 0.01 427 0.01 231 0.01 415 0.01 071 0.01 905 0.01 832 0.01 0.02 0.02 0.01 0.02 744 487 026 402 341 AT 0.03 0.04 0.03 0.03 A 056 06 846 257 BU 0.02 0.03 0.02 N 492 42 EDe 0.00 + + + + + + + + + + + + + + + + + + + + + + + + + + + 0.02 73 0.01 797 + + + + + + + + + + + + 0.00 669 0.01 551 0.01 065 0.01 487 - + + + + + + + + + + 0.00 324 0.00 554 0.01 339 0.01 144 0.00 903 0.00 + + + + + + + + + + 0.01 252 0.00 93 0.00 581 0.02 431 0.02 925 0.02 436 0.00 888 0.00 931 + + + + + + + + + 0.02 0.01 0.01 0.01 0.02 0.03 0.03 0.01 0.01 0.00 794 702 317 631 415 601 569 777 422 966 + + + + + + + + 0.04 0.03 0.03 0.02 0.03 0.04 0.05 0.06 0.03 0.03 0.03 0.02 511 973 818 804 927 849 576 316 12 422 809 357 + + + + + + + 0.02 0.03 0.03 0.03 0.02 0.02 0.03 0.04 0.04 0.02 0.02 0.01 0.01 0.01 834 324 858 236 168 364 988 287 653 472 619 56 982 687 919 + + + + + + 0.00 0.00 0.00 0.00 0.01 0.00 0.00 0.01 0.00 0.02 0.02 0.01 0.00 0.01 0.01 0.04 0.03 896 931 828 455 803 248 232 436 099 759 464 66 575 903 483 984 149 105 - - + + + EDe 0.00 0.01 0.00 0.00 0.00 0.01 0.00 0.00 0.00 0.00 0.02 0.02 0.01 0.00 0.01 0.01 0.03 0.03 903 324 642 463 214 049 244 173 732 849 351 703 161 313 847 981 341 0.00 043 - + + + EDe 0.00 0.01 0.00 0.00 0.00 0.01 0.00 0.00 0.01 0.00 0.01 0.02 0.01 0.00 0.01 0.01 0.04 0.03 0.00 81 345 762 579 152 291 484 172 721 946 898 474 977 893 988 035 648 083 + + + TIB AM I PAI 017 - 0.00 106 Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Công ngh thông tin document, khoa luan, tieu luan, 123doc, Tai lieu60 of 98 61 of 98 51 Ede 0.01 0.01 0.00 0.00 0.00 0.01 0.00 0.00 0.01 0.00 0.02 0.02 0.01 0.01 0.01 0.02 0.04 0.03 0.00 0.00 0.00 233 481 931 968 551 077 505 804 136 824 256 054 346 121 871 564 773 46 275 348 44 0.02 0.01 0.01 0.02 0.02 0.02 0.01 0.01 0.01 0.02 0.03 0.03 0.01 0.01 0.01 0.02 0.04 0.02 0.02 0.02 0.02 0.02 026 304 638 081 365 287 944 922 573 948 222 321 621 69 285 556 654 951 346 427 577 222 0.04 568 0.04 694 0.03 791 0.04 434 0.04 943 0.04 325 0.04 186 0.04 079 0.04 04 0.04 659 0.04 82 0.05 992 0.04 155 0.03 575 0.03 945 0.03 76 0.06 083 0.04 872 0.04 344 0.04 192 0.04 434 0.04 858 Bru Ma r Tng hp án, khóa lun, tiu lun, chuyên lun tt nghip i hc v chuyên ngành: Kinh t, Tài Chính & Ngân Hàng, Công ngh thông tin document, khoa luan, tieu luan, 123doc, Tai lieu61 of 98 + + + 0.04 975