Hai tộc người còn lại gồm người Mường và người Nùng, mặc dù số lượng mẫu cá thể thu được đủ lớn, lần lượt là 155 mẫu và 405 mẫu, tuy nhiên nghiên cứu khơng phát hiện thấy locus có tính đặc trưng tộc người.
Như vậy, các alen đặc trưng tộc người được phát hiện trong 9 tộc người nghiên cứu thường là các alen có tần suất thấp hoặc chỉ gặp ở tộc người này mà khơng gặp ở tộc người khác, hoặc có tần suất cao hơn các tộc người khác nhiều lần. Kết quả được thống kê trong Bảng 3.9.
Bảng 3.9. Thống kê các alen đặc trưng của các tộc người
Tộc ngƣời Locus
Kinh Tày Thái Mường Khmer Hoa Nùng H’mông Dao D8S1179 8 8, 19 D21S11 26, 34 19 D7S820 4, 23, 24 14, 15 9.2 CSF1PO 10.2 6 D3S1358 10 7 TH01 12 8 D13S317 15 16 15, 16 D16S539 19 18 D2S1338 13.2, 14.2 13 26 D19S433 17 vWA 8, 29 15.2 12 18.2 TPOX 14, 15 D18S51 5, 13.2 15.2, 26 9.2, 13.2 18.2 D5S818 20 16 23 FGA 9, 10 29.2 14, 18.2 20.2 28.2 Tổng 17 8 8 0 3 3 0 12 2
Trong 54 alen có tần suất thấp mang đặc trưng tộc người được tìm thấy ở 9 tộc người có dân số đơng nhất tại Việt Nam, một số alen cũng đã gặp trong các quần thể khác như người Hàn Quốc [56, 58], người Nhật Bản [41] và người Philippin [56]. Người Hàn Quốc trùng 5/24 các alen có tần suất thấp, người Nhật Bản trùng 4/27 và người Philippin trùng 2/23 các alen có tần suất thấp (Bảng 3.10).
Bảng 3.10. So sánh các alen có tần suất thấp nhất của nghiên cứu và một số quần thể khác ở châu Á [56] Tộc ngƣời Locus 13.396 mẫu thuộc 9 tộc ngƣời Việt Nam 1805 mẫu ngƣời Hàn Quốc 650 ngƣời Nhật Bản 106 ngƣời Philippin D8S1179 8, 19 18 8 12, 17 D21S11 19, 26, 34 9, 9.2, 19 24 26,30.2, 34.2, 36.2 D7S820 4, 9.2, 14, 15, 23, 24 5, 10.3 7 13 CSF1PO 6, 10.2 7, 15 6 7, 8, 14 D3S1358 7, 10 9, 20 13, 20 19 TH01 8,12 5 4 5 D13S317 15, 16 16,17 15 14 D16S539 18, 19 8 15 7 D2S1338 13, 13.2, 14.2, 26 19 15 26 D19S433 17 17, 18.2 9, 11.2, 17.2, 19.2 10 vWA 8, 12, 15.2, 18.2, 29 12 12, 13, 21, 22 13 TPOX 14,15 14 13 10 D18S51 5, 9.2, 13.2, 15.2, 18.2, 26 25 14.2, 25 21, 24 D5S818 16, 20, 23 6, 10.1 7 14 FGA 9, 10, 14, 18.2, 20.2, 28.2, 29.2 12, 19 21.2, 23.2, 26.2, 28, 29 23.2, 27
3.6. Các chỉ số đánh giá trong giám định ADN hình sự
Nếu một mẫu ADN thu được ở hiện trường cho kết quả kiểm tra giống với mẫu ADN của đối tượng khả nghi thì câu hỏi đặt ra là liệu hai mẫu đó có phải từ cùng một người khơng? Việc khẳng định xác suất chính xác là bao nhiêu, phụ thuộc vào độ tin cậy của phương pháp và khả năng phân biệt của từng locus nghiên cứu, phân tích. Việc xác định khả năng phân biệt của từng locus giúp tính tốn được độ chính xác của phương pháp trong từng trường hợp cụ thể, hạn chế tối đa định hướng điều tra sai. Trong trường hợp địi hỏi phải có độ chính xác cao hơn thì cần nghiên cứu bổ sung thêm các locus STR khác hoặc kết hợp với các nguồn chứng cứ điều tra khác để cho kết quả cao nhất.
Các chỉ số thống kê cho quần thể cũng được tính tốn trong nghiên cứu bao gồm chỉ số 2, tỷ lệ dị hợp tử (h), khả năng phân biệt (PD), khả năng loại trừ (PE) của locus trong quần thể. Kết quả kiểm tra chỉ số 2 cho thấy tần suất phân bố của
15 locus STR từ kết quả khảo sát thực nghiệm của chúng tôi là phù hợp với phân bố lý thuyết theo định luật cân bằng Hardy–Weinberg với độ tin cậy 95%. (Phụ lục 2)
Bảng 3.11 là tổng hợp chỉ số khả năng phân biệt (PD) của 15 locus trong nghiên cứu 9 tộc người người tại Việt Nam.
Bảng 3.11. Chỉ số khả năng phân biệt (PD) của 15 locus của các tộc người nghiên cứu
Tộc ngƣời Locus KB KT KN TY TI MG KM HA NG HM DO Trung bình D8S1179 0,96 0,965 0,964 0,957 0,958 0,96 0,954 0,96 0,972 0,931 0,961 0,958 D21S11 0,948 0,945 0,948 0,946 0,944 0,957 0,935 0,938 0,956 0,951 0,938 0,946 D7S820 0,911 0,907 0,921 0,905 0,914 0,918 0,92 0,915 0,933 0,862 0,858 0,906 CSF1PO 0,88 0,89 0,885 0,881 0,874 0,879 0,856 0,873 0,863 0,781 0,868 0,866 D3S1358 0,885 0,867 0,873 0,874 0,881 0,861 0,872 0,879 0,909 0,853 0,874 0,875 TH01 0,878 0,89 0,909 0,865 0,839 0,9 0,901 0,877 0,914 0,843 0,851 0,879 D13S317 0,923 0,923 0,931 0,921 0,912 0,916 0,922 0,913 0,926 0,829 0,914 0,912 D16S539 0,918 0,913 0,92 0,905 0,912 0,901 0,916 0,917 0,908 0,88 0,897 0,908 D2S1338 0,969 0,972 0,964 0,966 0,971 0,969 0,961 0,966 0,977 0,934 0,964 0,965 D19S433 0,948 0,948 0,944 0,942 0,956 0,95 0,953 0,933 0,96 0,94 0,943 0,947 vWA 0,918 0,928 0,926 0,917 0,931 0,921 0,934 0,928 0,942 0,892 0,916 0,923 TPOX 0,77 0,8 0,779 0,758 0,748 0,735 0,767 0,806 0,853 0,773 0,77 0,778 D18S51 0,959 0,967 0,965 0,967 0,963 0,958 0,96 0,964 0,973 0,946 0,964 0,962 D5S818 0,911 0,926 0,928 0,921 0,914 0,922 0,901 0,919 0,949 0,901 0,917 0,919 FGA 0,966 0,975 0,971 0,971 0,965 0,971 0,969 0,971 0,976 0,957 0,966 0,969
Ghi chú: KB: Kinh miền Bắc; KT: Kinh miền Trung, KN: Kinh miền Nam; TY: Tày; TI: Thái;
MG: Mường; KM: Khmer; HM: H’mông; HA: Hoa; MG: Mường; NG: Nùng và DO: Dao
Đánh giá theo khả năng phân biệt từ cao đến thấp của các locus trong quần thể nghiên cứu, chúng tơi thấy locus FGA có khả năng phân biệt cao nhất (0,97), locus TPOX có khả năng phân biệt thấp nhất (0,77). Sắp xếp theo thứ tự khả năng phân biệt từ cao đến thấp của tất cả các locus nghiên cứu lần lượt là: FGA, D18S51, D2S1338, D8S1179, D19S433, D21S11, vWA, D16S539, D5S818, D13S317, D7S820, TH01, D3S1358, CSF1PO, TPOX. Mỗi một locus có khả năng phân biệt khác nhau, vì vậy, có vai trị quan trọng khác nhau trong việc tính tốn độ tin cậy của phương pháp nghiên cứu. Locus nào có khả năng phân biệt càng cao thì càng có ý nghĩa trong giám định [40]. Vì vậy, khi xây dựng những bộ kít xét nghiệm riêng cho từng nhóm người cụ thể cần lưu ý nhiều hơn đến các locus này.
Khả năng loại trừ (PE) cũng là chỉ số để đánh giá độ tin cậy trong giám định. Bảng 3.12 là tổng hợp các khả năng loại trừ của 15 locus trong nghiên cứu 9 tộc người Việt Nam.
Bảng 3.12. Chỉ số khả năng loại trừ (PE) của 15 locus trong nghiên cứu các tộc người
Tộc ngƣời Locus KB KT KN TY TI MG KM HA NG HM DO Trung bình D8S1179 0,72 0,731 0,72 0,705 0,712 0,706 0,688 0,702 0,704 0,598 0,703 0,70 D21S11 0,649 0,644 0,637 0,67 0,592 0,689 0,619 0,636 0,63 0,692 0,621 0,64 D7S820 0,548 0,537 0,565 0,537 0,551 0,57 0,575 0,572 0,526 0,46 0,478 0,54 CSF1PO 0,5 0,485 0,5 0,477 0,468 0,48 0,436 0,466 0,457 0,347 0,451 0,46 D3S1358 0,471 0,449 0,466 0,478 0,507 0,448 0,468 0,464 0,472 0,441 0,463 0,47 TH01 0,511 0,504 0,483 0,503 0,43 0,525 0,526 0,407 0,465 0,393 0,43 0,47 D13S317 0,57 0,587 0,569 0,57 0,572 0,562 0,586 0,589 0,567 0,311 0,574 0,55 D16S539 0,59 0,564 0,572 0,554 0,578 0,53 0,571 0,566 0,533 0,499 0,555 0,56 D2S1338 0,733 0,747 0,708 0,735 0,755 0,74 0,709 0,717 0,733 0,664 0,734 0,73 D19S433 0,658 0,667 0,659 0,631 0,7 0,664 0,676 0,63 0,634 0,596 0,641 0,65 vWA 0,596 0,606 0,613 0,576 0,601 0,583 0,619 0,614 0,604 0,523 0,578 0,59 TPOX 0,289 0,308 0,294 0,273 0,288 0,238 0,277 0,283 0,328 0,309 0,282 0,29 D18S51 0,709 0,73 0,72 0,694 0,724 0,694 0,703 0,733 0,715 0,631 0,724 0,71 D5S818 0,599 0,592 0,588 0,566 0,519 0,586 0,535 0,608 0,583 0,523 0,589 0,57 FGA 0,732 0,765 0,773 0,755 0,724 0,75 0,741 0,742 0,755 0,717 0,75 0,75
Ghi chú: KB: Kinh miền Bắc; KT: Kinh miền Trung, KN: Kinh miền Nam; TY: Tày; TI: Thái;
MG: Mường; KM: Khmer; HM: H’mông; HA: Hoa; MG: Mường; NG: Nùng và DO: Dao
Đánh giá theo khả năng loại trừ (PE) từ cao đến thấp của các locus trong quần thể nghiên cứu, locus FGA có khả năng loại trừ cao nhất (0,75), locus TPOX có khả năng loại trừ thấp nhất (0,29). Sắp xếp theo thứ tự khả năng loại trừ từ cao đến thấp của tất cả các locus nghiên cứu lần lượt là: FGA, D2S1338, D18S51, D8S1179, D19S433, D21S11, vWA, D5S818, D16S539, D13S317, D7S820, TH01, D3S1358, CSF1PO, TPOX. Mỗi một locus có khả năng loại trừ khác nhau, vì vậy, nó có vai trị quan trọng khác nhau trong việc tính tốn độ tin cậy. Locus càng có
khả năng loại trừ cao thì càng có ý nghĩa trong giám định truy nguyên cá thể và xác định huyết thống cha - mẹ con.
Đối với chỉ số quan hệ huyết thống - Paternity index (PI), việc đánh giá giá trị của chỉ số PI của một locus ADN trong bảng tần suất tính được phụ thuộc vào giá trị của chúng.
Nếu PI ≤ 1, locus đó khơng có giá trị trong việc xác định huyết thống cha, mẹ - con.
Nếu PI >1, thì locus đó có giá trị trong việc xác định huyết thống cha, mẹ - con. Tính đa hình của locus đó càng lớn thì giá trị này càng cao và càng có giá trị cao trong việc xác định huyết thống cha, mẹ - con [53].
Kết quả ở Bảng 3.13 cho thấy tất cả các locus của các tộc người đều cho giá trị lớn hơn 1, tuy nhiên khả năng xác định huyết thống cha, mẹ - con của từng locus có sự khác nhau, cao nhất ở locus FGA, có giá trị trung bình là 3,74 và thấp nhất ở locus TPOX có có giá trị trung bình là 1,22.
Bảng 3.13. Chỉ số xác định quan hệ huyết thống cha con (PI) dựa vào tần suất alen của các tộc người
Tộc ngƣời Locus KB KT KN TY TI MG KM HA NG HM DO Trung bình D8S1179 3,37 5,07 3,64 3,38 3,21 3,36 3,16 3,27 3,4 2,38 3 3,39 D21S11 2,87 3,43 3,57 2,73 2,49 3,14 2,54 3,27 2,76 3,11 2,53 2,95 D7S820 2,07 2,28 2,33 2,03 1,82 2,23 2,26 2,67 1,94 1,6 1,7 2,08 CSF1PO 1,75 1,8 1,63 1,87 1,77 1,81 1,66 1,6 2,1 1,27 2,15 1,76 D3S1358 1,85 1,99 1,72 2 2,03 1,72 1,78 1,53 2,08 1,62 1,7 1,82 TH01 1,78 1,85 1,73 1,82 1,58 2 2,01 2 1,7 1,56 1,58 1,78 D13S317 2,03 2,32 2,19 2,25 1,89 2,18 2,34 1,76 2,1 1,18 1,93 2,02 D16S539 2,29 2,32 1,98 2,22 2,37 2,03 2,26 2,4 1,87 1,52 2,48 2,16 D2S1338 3,69 3,61 3,25 3,43 3,63 3,79 3,38 5,54 4,16 2,82 3,46 3,7 D19S433 2,77 2,54 2,56 2,57 2,68 2,89 3,01 2,18 2,76 2,71 3,35 2,73 vWA 2,31 2,36 2,64 2,46 2,31 2,31 2,56 2,18 2,96 2,04 1,81 2,36 TPOX 1,21 1,26 1,23 1,25 1,11 1,09 1,17 1,5 1,2 1,21 1,25 1,22 D18S51 3,39 3,19 3,96 3,99 3,81 3,21 3,29 3,43 3,05 3,5 3,8 3,51 D5S818 2,23 2,21 2,12 2,35 2,14 2,35 2,07 2 2,27 2,1 2,33 2,2 FGA 3,76 5,96 3,19 4,06 3,56 3,94 3,82 3,43 3,24 3,33 2,85 3,74
Ghi chú: KB: Kinh miền Bắc; KT: Kinh miền Trung, KN: Kinh miền Nam; TY: Tày; TI: Thái;
Để đánh giá chất lượng bảng tần suất cũng như khả năng áp dụng vào công tác giám định ADN, các chỉ số kết hợp được tính tốn bao gồm: Chỉ số kết hợp khả năng loại trừ - combined power of exclusion (CPE), chỉ số kết hợp khả năng phân biệt - combined power of discrimination (CPD) của 11 bảng tần suất alen trong nghiên cứu đã cho thấy, cả 11 bảng tần suất đều có giá trị cao trong truy nguyên cá thể sử dụng trong giám định ADN. Các giá trị CPD đạt cao nhất ở bảng tần suất của tộc người Nùng (0,9999999999999999997307) và thấp nhất ở bảng tần suất của tộc người H‟mông (0,999999999999990007993) (Bảng 3.14). Điều này cũng phù hợp với tính đa hình của các locus ADN trong các bảng tính.
Bảng 3.14. Tổng hợp các chỉ số đánh giá giá trị các bảng tần suất thu được
Các chỉ số
Tộc ngƣời CPD C(1-PD) CPE CPI KB 0,999999999999999990948 7,4210-18 0,999997555 1928022 KT 0,9999999999999999965689 2,4710-18 0,999998505 399144 KN 0,9999999999999999964674 2,6110-18 0,999998519 6000 TY 0,9999999999999999879094 110-17 0,999997147 825 TI 0,9999999999999999864586 9,3410-18 0,999997032 1256 MG 0,999999999999999992302 6,0810-18 0,999997673 982 KM 0,999999999999999985006 9,910-18 0,999996888 3804 HA 0,9999999999999999892477 7,74810-18 0,999997347 9279 NG 0,9999999999999999997307 1,5610-19 0,999999541 5745180 HM 0,999999999999990007993 1,0810-15 0,999971396 160927 DO 0,9999999999999996615749 3,0410-17 0,999995035 27195
Ghi chú: KB: Kinh miền Bắc; KT: Kinh miền Trung, KN: Kinh miền Nam; TY: Tày; TI: Thái;
MG: Mường; KM: Khmer; HM: H’mông; HA: Hoa; MG: Mường; NG: Nùng và DO: Dao
Khi so sánh kết quả các chỉ số CPE và CPD với cùng hệ Identifiler của một số nghiên cứu khác về tần suất alen, kết quả của chúng tôi cũng phù hợp với các nghiên cứu được tham khảo (Bảng 3.15).
Bảng 3.15. So sánh các chỉ số đánh giá giá trị CPE, CPD với nghiên cứu khác
Các chỉ số
Tài liệu tham khảo CPD CPE
Nguồn tham khảo Ngƣời Khmer tại Việt Nam 0,999999999999999985006 0,999996888 Số liệu luận án
Ngƣời Hoa tại Việt Nam 0,9999999999999999892477 0,999997347 Số liệu luận án
Ngƣời Nùng tại Việt Nam 0,9999999999999999997307 0,999999541 Số liệu luận án
Ngƣời H’mông tại Việt Nam 0,999999999999990007993 0,999971396 Số liệu luận án
Ngƣời Dao tại Việt Nam 0,9999999999999996615749 0,999995035 Số liệu luận án
Ngƣời Hán tại Bắc Kinh (N = 200) 0,99999999999999999995 0,9999992 [63]
Ngƣời Philippin (N = 181) 0,99999999 0,99999904 [56]
Ngƣời Hàn Quốc (N = 231) 0,99999999999999715 0,9999968 [58]
3.7. Xây dựng khoảng cách di truyền giữa các tộc ngƣời
Dựa vào tần suất 15 locus nghiên cứu của tộc người Kinh và 8 tộc người thiểu số có số dân đơng nhất tại Việt Nam, khoảng cách di truyền đã được tính tốn và dự cây về khoảng cách di truyền bằng phần mềm POPTREE2. Các tộc người này được chia theo các vùng địa lý theo quy định của Việt Nam.
Chúng tôi đã tiến hành tập hợp các mẫu thu được của tộc người Kinh theo 3 vùng địa lý trên lãnh thổ Việt Nam, tính khoảng cách di truyền và xây dựng cây phân loại di tryền nhằm tìm hiểu mối quan hệ di truyền giữa 3 nhóm người Kinh được phân tách theo 3 vùng địa lý và 8 tộc người có số dân đơng đã nghiên cứu. Kết quả tính khoảng cách di truyền của các tộc người được thể hiện ở Bảng 3.16.
Bảng 3.16. Giá trị khoảng cách di truyền giữa các tộc người
KT KN TY TI MG KM HA NG HM DO KB 0,007 0,007 0,008 0,011 0,009 0,011 0,015 0,007 0,041 0,010 KT 0,008 0,011 0,013 0,011 0,015 0,017 0,008 0,042 0,011 KN 0,010 0,013 0,010 0,014 0,016 0,009 0,041 0,012 TY 0,014 0,010 0,014 0,017 0,007 0,037 0,010 TI 0,015 0,015 0,020 0,012 0,044 0,013 MG 0,015 0,019 0,009 0,045 0,014 KM 0,019 0,012 0,043 0,015 HA 0,015 0,044 0,013 NG 0,038 0,009 HM 0,032
Ghi chú: KB: Kinh miền Bắc; KT: Kinh miền Trung, KN: Kinh miền Nam; TY: Tày; TI: Thái;
Kết quả trên Bảng 3.16 đã cho thấy giá trị khoảng cách di truyền nhỏ nhất là giữa các nhóm người Kinh, cũng như giữa người Kinh và người Nùng, người Tày, Mường. Khoảng cách di truyền lớn nhất là giữa người H‟mơng và các tộc người cịn lại, tuy nhiên, các giá trị này cao nhất cũng chỉ là 0,045. Như vậy, dữ liệu về khoảng cách di truyền đã phản ánh mối quan hệ gần gũi giữa các tộc người sinh sống lâu đời ở Việt Nam.
Từ dữ liệu về khoảng cách di truyền, cây phân loại di truyền giữa các tộc người đã được xây dựng bằng phần mềm POPTREE2 (hình 3.33).
Hình 3.33. Cây phân loại di truyền giữa các tộc người nghiên cứu và 3 nhóm người Kinh
Ghi chú: KB: Kinh miền Bắc; KT: Kinh miền Trung, KN: Kinh miền Nam; TY: Tày; TI: Thái;
MG: Mường; KM: Khmer; HM: H’mông; HA: Hoa; MG: Mường; NG: Nùng và DO: Dao
Hình 3.33 cho thấy cây phân loại di tryền đã thể hiện rõ 3 nhóm gồm: Nhóm 1: Nhóm người Kinh miền Bắc, miền Trung và miền Nam Nhóm 2: Nhóm tộc người Mường, Tày và Nùng
Mặc dù người Kinh miền Bắc, miền Trung và miền Nam được định cư ở 3 vùng địa lý khác nhau nhưng vẫn thể hiện thuộc cùng một nhóm trong cây phân loại di truyền và thuộc cùng tộc người Kinh. Cả 3 nhóm trên hình thành nên một nhánh riêng, tách biệt so với người Hoa, người Dao và người H‟mông. Đáng chú ý là người H‟mông, tộc người này tách hẳn ra khỏi các tộc người còn lại. Điều này đã thể hiện sự thay đổi về tần suất alen trong các biến dị sinh học người dẫn đến sự phân ly giữa người H‟mông và các tộc người còn lại.
Như vậy, với kết quả phân tích chủng loại phát sinh ở trên, trong giám định