Mục tiêu chính của luận án là đánh giá tính đặc trưng tần suất alen của 09 tộc người và đưa ra được bảng tần suất alen của 15 locus STR đối với 09 tộc người tại Việt Nam. Xây dựng được bảng tính ứng dụng dựa vào phần mềm Excel, sử dụng tần suất alen của các tộc người để tính chỉ số truy nguyên cá thể và xác định quan hệ huyết thống trong giám định ADN.
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - Trịnh Tuấn Toàn NGHIÊN CỨU ĐẶC TRƢNG TẦN SUẤT CÁC ALLEN HỆ NHẬN DẠNG CỦA MỘT SỐ TỘC NGƢỜI VIỆT NAM ĐỂ PHỤC VỤ ỨNG DỤNG TRONG GIÁM ĐỊNH SINH HỌC PHÁP LÝ Chuyên ngành: Hóa sinh học Mã số: 62420116 DỰ THẢO TÓM TẮT LUẬN ÁN TIẾN SĨ SINH HỌC Hà Nội - 2018 Cơng trình đƣợc hồn thành tại: Bộ mơn Hóa sinh Sinh học phân tử, Khoa Sinh học, Trường Đại học Khoa học Tự nhiên, ĐHQG Hà Nội Người hướng dẫn khoa học: PGS.TS Nguyễn Quang Huy PGS.TS Trịnh Hồng Thái Phản biện: Phản biện: Phản biện: Luận án bảo vệ trước Hội đồng cấp sở chấm luận án tiến sĩ họp tại: Trường Đại học Khoa học Tự nhiên, ĐHQGHN vào hồi: ngày tháng năm 2018 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam - Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội MỞ ĐẦU Cùng với phát triển khoa học - công nghệ sinh học năm đầu kỷ XXI, nhà khoa học thành cơng giải mã tồn hệ gen người Dấu vết sinh học thu trường vụ án thường bị phân hủy, biến tính thơng qua phân tích ADN cung cấp chứng quan trọng giúp truy nguyên thủ phạm vụ án truy tìm tung tích nạn nhân cách xác Hiện nay, công tác giám định sinh học giới, giám định ADN khoa học hình chủ yếu sử dụng thị STR (Short Tandem Repeat), đoạn ADN có cấu trúc lặp lại từ bp - bp, có tính bảo thủ cao, di truyền qua hệ mang tính đặc trưng cá thể Tính cấp thiết đề tài luận án Trong thời gian gần đây, tình trạng vi phạm pháp luật vùng đồng bào tộc người thiểu số địa bàn miền núi, vùng xa có chiều hướng gia tăng số lượng mức độ nghiêm trọng Mỗi tộc người có đặc trưng sinh học định, mức ADN, thể phân bố khác tần suất alen tộc người Việc khảo sát tần suất alen locus STR áp dụng tộc người, trước hết tộc người có số dân đơng, toàn lãnh thổ Việt Nam cấp bách, tiến hành thực đề tài : " Nghiên cứu đặc trưng tần suất allen hệ nhận dạng số tộc người Việt Nam để phục vụ ứng dụng giám định sinh học pháp lý" Mục tiêu nghiên cứu luận án Xác định tần suất alen 15 locus STR thuộc kít AmpFlSTR® Identifiler® Plus 09 tộc người có dân số đơng Việt Nam (người Kinh, Tày, Thái, Mường, Khmer, Hoa, Nùng, H’mông Dao) Đánh giá tính đặc trưng tần suất alen 09 tộc người đưa bảng tần suất alen 15 locus STR 09 tộc người Việt Nam Xây dựng bảng tính ứng dụng dựa vào phần mềm Excel, sử dụng tần suất alen tộc người để tính số truy nguyên cá thể xác định quan hệ huyết thống giám định ADN Nội dung nghiên cứu luận án Thu thập mẫu cá thể tộc người, xếp mẫu thu theo tộc người dựa hồ sơ lý lịch quản lý lực lượng Cơng an quyền địa phương nơi người cư trú Phân tích, xác định hồ sơ ADN (DNA profile) tất mẫu thống kê, thu thập tính tần suất tộc người, kiểm định giả thiết 2, xác định đánh giá thông số bảng tần suất alen sử dụng khoa học hình cho tộc người Xác định tính đặc trưng tần suất alen tộc người dựa vào phân bố tần suất alen kít AmpFlSTR® Identifiler® Plus đánh giá alen có tần suất cao, alen có tần suất thấp tộc người, alen đặc trưng tộc người (nếu có), xây dựng phát sinh chủng loại Xây dựng bảng tính Excel xác định số truy nguyên cá thể, số quan hệ huyết thống áp dụng bảng tính vào thực tế cơng tác giám định ADN 4 Những đóng góp luận án Đây cơng trình phân tích 13.396 mẫu máu tộc người có số dân đơng Việt Nam thu thập tất tỉnh thành phố toàn lãnh thổ Việt Nam Nghiên cứu xác định tần suất alen thuộc 15 locus STR 09 tộc người có số dân đơng Việt Nam, đủ điều kiện để ứng dụng, cụ thể: Đã xác định tần suất alen, tần suất dị hợp, khả phân biệt (PD), khả loại trừ (PE), số xác định huyết thống điển hình (TPI) 15 locus STR kít AmpFlSTR® Identifiler® Plus Đã phát 54 alen tần suất thấp chưa có thang alen chuẩn quốc tế tất tộc người nghiên cứu khảo sát Phát 53 alen có tính đặc trưng cho tộc người Trên sở tính khoảng cách di truyền (D) lập phát sinh chủng loại cho thấy tộc người Kinh ba miền Bắc, Trung, Nam có quan hệ gần Các tộc người Mường, Tày, Nùng thành nhóm có quan hệ gần với người Kinh; tộc người Hoa tộc người Khmer có khoảng cách di truyền xa Tộc người H’mông Dao tách thành hai nhóm riêng, khác biệt khác biệt với tộc người cịn lại Các locus có khả phân biệt cao người Việt Nam FGA, D2S1338, D18S51, D8S1179, D19S433, D21S11 Đã xây dựng Bảng tính số truy nguyên cá thể, quan hệ huyết thống áp dụng vào thực tế giám định ADN Chƣơng 1: TỔNG QUAN 1.1 Tổng quan nhận dạng cá thể ngƣời ADN Vào đầu năm 1980, vùng nghiên cứu để đánh dấu hệ gen người người sáng lập "DNA typing" Alec Jeffreys, ơng nhanh chóng nhận dấu hiệu sử dụng cho việc nhận dạng cá thể người 1.2 STR nhận dạng cá thể ngƣời 1.2.1 Khái niệm đoạn lặp VNTR STR ứng dụng Các gen sử dụng giám định hình gen nằm vùng khơng mã hố ADN Ở giai đoạn đầu tiên, người ta áp dụng phân tích gen có tính đa hình số đoạn lặp liên tiếp (Variable Number of Tandem Repeat - VNTR hay Minisatellite) Từ năm 1990 tới nay, sử dụng kỹ thuật phân tích gen có trình tự lặp lại ngắn (Short Tandem Repeat - STR hay Microsatellite) 1.2.2 Danh pháp thị ADN - STR Tên locus ADN đặt theo tên gen locus nằm phần nằm toàn gen Ví dụ thị STR TH01 có nguồn gốc từ tên gen tổng hợp enzym tyrosine hydroxylase người, nằm NST số 11 Chữ "TH" xuất phát từ chữ đầu tyrosine hydroxylase Phần "01" ký hiệu "TH01" xuất phát từ vùng intron gen tổng hợp enzym tyrosine hydroxylase Các trình tự ADN nằm ngồi vùng gen xác định tên vị trí chúng NST 1.3 Bộ kít AmpFlSTR® Identifiler® Plus Hiện nay, đa số phịng thí nghiệm tiên tiến giới sử dụng kít AmpFlSTR® Identifiler® Plus hãng Applied Biosystems (Mỹ) cho giám định ADN hình có nhiều ưu điểm 1.4 Cơ sở khoa học cần phải xác định tần suất alen hệ STR tộc ngƣời khác 1.4.1 Tỉ lệ giống (LR) áp dụng khoa học hình Khi tính tốn với tần suất alen tộc người khác cho kết LR lớn 1.4.2 Alen có tần suất thấp Để xác định xác tần suất alen, cần phải thu thập nhiều giới hạn cực tiểu cho alen 1.4.3 Alen có tần suất cao - Alen phổ biến Một yêu cầu quan trọng đặt locus ADN - STR sử dụng khoa học hình tính dị hợp tử phải cao (trên 70%) 1.5 Quy trình chung thực giám định ADN GIÁM ĐỊNH TÁCH BIỆT Đối tƣợng giám định Mẫu so sánh Tìm dấu vết, mơ tả, đánh giá dấu vết Mô tả, chụp ảnh, đánh giá chất lượng mẫu vật Xác định loại dấu vết (theo quy trình xác định riêng) Tách chiết ADN Tinh ADN Định lượng ADN Nhân bội ADN Điện di phân tích kết Hình 1.3 Sơ đồ q trình thực giám định ADN 1.6 Quy trình giám định ADN áp dụng Việt Nam 1.6.1 Tách chiết ADN 1.6.1.1 Phương pháp tách chiết hữu (phương pháp tách chiết phenol/chloroform) 1.6.1.2 Tách chiết Chelex 1.6.1.3 Phương pháp tách chiết mẫu từ giấy FTA Hiện tại, Viện Khoa học hình sử dụng robot TECANTM để tách chiết, phân tích ADN tự động từ mẫu thu giấy FTA 1.6.1.4 Một số phương pháp tách chiết khác Ngoài phương pháp tách chiết ADN người ta sử dụng số phương pháp khác để tách chiết thành cơng ADN Tách chiết có hiệu cao tách chiết Prefiler PrepFiler™ Forensic DNA Extraction Kit hãng Themor Fisher (Mỹ) IQTM system hãng Promega (Mỹ) 1.6.2 Định lượng ADN Việc xác định hàm lượng ADN mẫu cần thiết biết xác độ tinh hàm lượng ADN mẫu tính nồng độ tối ưu thành phần kỹ thuật PCR thu kết tốt Có nhiều phương pháp định lượng khác như: Phương pháp sử dụng kít định lượng chạy máy real - time PCR; Phương pháp đo mật độ quang ADN quang phổ kế, phương pháp điện di nhỏ, nhiên, phương pháp định lượng ADN Real - time PCR đạt độ xác đặc cao 1.6.2.1 Định lượng ADN phương pháp real - time PCR Real - time PCR kĩ thuật PCR mà kết nhân ADN đích hiển thị sau chu kỳ nhiệt phản ứng 1.6.2.2 Định lượng ADN phương pháp đo quang phổ hấp thụ phân tử máy Quawell Q6000 Ưu điểm: Cho kết nhanh, độ xác chấp nhận Nhược điểm: Thiếu độ xác định lượng ADN đặc hiệu loài Chỉ kiểm tra hàm lượng ADN mẫu tinh khiết 1.6.3 Nhân ADN - PCR Hiện phần lớn phịng thí nghiệm sử dụng kit nhân gen (PCR) hãng khác Các kit thông dụng hay sử dụng giám định ADN gồm Kit Identifiler, Identifiler Plus, Identifiler Direct, Globalfiler 1.6.4 Điện di ADN, phát sản phẩm PCR thu liệu hồ sơ ADN mẫu giám định Hiện sử dụng điện di máy điện di mao quản (Capillary Electrophoresis - CE) trình giám định ADN 1.7 Khái quát tộc ngƣời Tộc người cộng đồng người có mối liên hệ chặt chẽ, bền vững, có sinh hoạt kinh tế chung, có ngơn ngữ riêng nét văn hóa đặc thù, xuất sau lạc, tộc Trong luận án, dựa vào quy định Nhà nước Cộng hịa xã hội chủ nghĩa Việt Nam, cơng nhận người thuộc tộc người dựa vào giấy khai sinh sơ yếu lý lịch người Đặc trưng tộc người Việt Nam có lối sống quần tụ, làng xã, tập trung khu vực sinh sống định, nên tần suất alen locus gen tương đối ổn định mang tính đặc trưng vùng, miền 1.8 Các khu vực địa lý lãnh thổ Việt Nam Việt Nam chia thành miền gồm miền Bắc, miền Trung miền Nam với tỉnh thuộc miền chia thành vùng nhỏ sau: Bắc Bộ chia thành vùng lãnh thổ nhỏ:Tây Bắc Bộ, Đông Bắc Bộ Đồng sông Hồng Miền Trung chia làm vùng:Bắc Trung Bộ, Tây Nguyên Nam Trung Bộ Việt Nam Nam Bộ :Vùng Đông Nam Bộ, đồng sông Cửu Long 1.9 Lựa chọn tộc ngƣời nghiên cứu 1.9.1 Cơ sở chọn lựa tộc người nghiên cứu Nghiên cứu lựa chọn 08 tộc người thiểu số sinh sống lãnh thổ Việt Nam, bao gồm tộc người có số dân khoảng triệu người trở lên (Tày, Thái, Mường, Khmer, H’mông, Nùng, Hoa, Dao) tộc người chiếm đại đa số dân cư tộc người Kinh 1.9.2 Tộc người Kinh Theo Tổng điều tra dân số nhà năm 2009, người Kinh Việt Nam có dân số 73.594.427 người, chiếm khoảng 86,2% dân số nước, cư trú tất 63 tỉnh, thành phố 1.9.3 Tộc người Tày Theo Tổng điều tra dân số nhà năm 2009, người Tày Việt Nam có dân số 1.626.392 người năm 2009 1.9.4 Tộc người Thái Theo Tổng điều tra dân số nhà năm 2009, người Thái Việt Nam có dân số 1.550.423 người 1.9.6 Tộc người Khmer Dân số người Khmer Việt Nam 1.260.640 người 1.9.7 Tộc người H’mông Theo Tổng điều tra dân số nhà năm 2009, người H’mơng Việt Nam có dân số 1.068.189 người 1.9.8 Tộc người Nùng Theo Tổng điều tra dân số nhà năm 2009, người Nùng Việt Nam có dân số 968.800 người, tộc người có dân số đứng thứ Việt Nam, 10 2.4 Phƣơng pháp nghiên cứu 2.4.1 Sơ đồ quy trình thực trình nghiên cứu Quyết định số lượng mẫu nhóm tộc người nghiên cứu Thu mẫu Phân tích ADN Tập hợp hồ sơ ADN Xác định tần suất alen Kiểm định thống kê, x/đ số Tộc người Tộc người Tộc người [[ Sử dụng bảng TS để xác định tần suất cơng thức ADN Hình 2.1 Sơ đồ bước xây dựng tần suất alen phục vụ giám định ADN 2.4.2 Phương pháp thu mẫu máu Mẫu máu cá thể thuộc tộc người khác cộng đồng tộc người Việt Nam thu thập ngẫu nhiên khơng có quan hệ huyết thống gần gũi Việc thu thập mẫu theo hồ sơ nhân thân cung cấp Công an quận, huyện trực thuộc tỉnh, thành phố 13 2.4.3 Địa điểm thu mẫu Địa điểm thu mẫu toàn quốc theo phân bố tộc người 2.4.4 Mẫu sử dụng cho xác định tần suất alen Bảng 2.1 Số lượng mẫu thu với tộc người dùng cho nghiên cứu Tộc Số mẫu Dân số Khu vực địa lý Tổng số ngƣời thu Đông Bắc Bộ 3.032 Tây Bắc Bộ 475 Đồng sông Hồng 5.191 Kinh 73.594.427 Bắc Trung Bộ 264 9.620 Miền Trung, T/N 285 Đông Nam Bộ 90 Tây Nam Bộ 283 444 1.626.392 Đông Bắc Bộ Tày 936 Tây Bắc Bộ 492 Điện Biên 255 Lai Châu 106 Thái 1.550.423 775 Sơn La 364 Yên Bái 50 Mường 1.268.963 Tây Bắc Bộ 155 155 Khmer 1.260.640 Đông Nam Bộ 150 150 Điện Biên 134 Hà Giang 76 Lai Châu 87 H’mông 1.068.189 Lào Cai 127 967 Sơn La 234 Yên Bái 161 Tây Bắc Bộ 148 Cao Bằng 148 Nùng 968.800 Lạng Sơn 218 405 Thái Nguyên 39 Hoa 823.071 Một số địa bàn 150 150 Đông Bắc Bộ 90 Dao 751.067 238 Tây Bắc Bộ 148 Tổng số 82.911.972 - (96,58% dân số) 13.396 13.396 14 2.4.5 Các bước tiến hành nghiên cứu (1) → Thu mẫu máu ADN từ cá thể FTA card (2) → Tách chiết ADN (3) → Định lượng ADN kít định lượng Quantifiler (4) → PCR nhân gen kít Identifiler plus (5) → Chạy điện di phân tích máy ABI 3130xl (6) → Phân tích kết xử lý số liệu (7) → Tính khoảng cách di truyền dựng phát sinh chủng loại (8) → Xây dựng bước tính tốn sử dụng phần mềm Excel (9) → Thử nghiệm áp dụng 2.4.6 Phương pháp tách chiết ADN Quy trình tách chiết ADN kít DNA PrepFiler™ Forensic DNA Extraction Kit sơ đồ theo bước sau : Hình 2.5 Quy trình tách chiết ADN kít PrepFiler 2.4.7 Phương pháp định lượng ADN Trong nghiên cứu này, ADN định lượng kít Quantifiler (Quantifiler™ Human DNA Quantification Kit - Mỹ) 2.4.8 Phương pháp PCR Hỗn hợp phản ứng biến tính máy PCR 9700 95oC vịng phút, sau lấy ủ vào đá lạnh phút Quá trình biến tính làm lạnh đột ngột đảm bảo hầu hết ADN từ dạng mạch đôi chuyển sang dạng mạch đơn hồn tồn 15 2.5 Phƣơng pháp tính tần suất alen, kiểm định giả thuyết thống kê số khoa học hình 2.5.1 Xác định tính tần suất alen tập hợp mẫu 2.5.2 Phương pháp kiểm định giả thiết χ2 2.5.3 Phương pháp tính số sử dụng khoa học hình 2.6 Các số kết hợp đánh giá giá trị bảng tần suất alen 2.6.1 Chỉ số kết hợp khả loại trừ - combined power of exclusion (CPE) 2.6.2 Chỉ số kết hợp khả phân biệt - power of discrimination (CPD) 2.6.3 Chỉ số xác định cha - Paternity index (PI) 2.6.4 Xác định đặc trưng tần suất quần thể thuộc tộc người khác Người Kinh, số lượng dân cư lớn, trải dài khắp đất nước, tách người Kinh thành 03 khu vực địa lý là: Bắc Bộ (các tỉnh phía Bắc đến hết tỉnh Hà Tĩnh), tỉnh Trung Bộ từ Quảng Bình đến Khánh Hòa, phần lại khu vực Nam Bộ tùy thuộc vào liệu thu thập tính đặc trưng vùng miền Dựa sở thông tin nhân thân cá thể thu mẫu, tách thành tộc người nhóm tộc người theo khu vực địa lý Xác định liệt kê alen có tần suất thấp (tần suất thấp 5/2N) có tộc người chưa thấy xuất tộc người khác số mẫu khảo sát Xây dựng biểu đồ, đồ thị để chứng minh kiểm định tính khác biệt tính đặc trưng tộc người, tộc người phân chia theo địa lý 16 2.6.5 Xây dựng phát sinh chủng loại (phylogeny) phần mềm POPTREE Chương trình POPTREE2 sử dụng để tính khoảng cách di truyền xây dựng phát sinh chủng loại quần thể cách sử dụng phương pháp láng giềng (NJ) (Saitou Nei 1987) phương pháp nhóm theo cặp với giá trị khoảng cách trung bình khơng theo trọng số (UPGMA) (Sneath Sokal 1973) 2.6.6 Xây dựng bảng tính ứng dụng Dựa vào ơng thức tính tốn thống kê khoa học hình để xây dựng bảng tính sử dụng phần mềm Excel áp dụng cho tính số quan hệ huyết thống, truy nguyên cá thể 2.6.7 Áp dụng bảng tính vào thực tế Đưa vào số vụ án cụ thể mà đối tượng phân tích hồ sơ ADN vụ án rõ danh tính, lai lịch, đặc biệt lai lịch tộc người Xác định mức độ sai lệch mẫu tính toán dựa bảng tần suất khác tộc người nghiên cứu Chƣơng 3: KẾT QUẢ VÀ THẢO LUẬN 3.1 Kết tách chiết ADN tổng số từ mẫu nghiên cứu Nồng độ ADN số mẫu (lấy làm ví dụ) thu nằm khoảng từ 8,0ng/ l đến 10,5 ng/ l ADN thu đạt 3.2 Xác định hồ sơ ADN mẫu nghiên cứu Sau thu mẫu ADN đạt tiêu chuẩn, bước tiếp theo, tiến hành phản ứng nhân gen để xác định đa hình locus STR Điện mẫu phân tích, kết thu so sánh kích thước băng ADN thu mẫu nghiên cứu với băng tương ứng thang alen chuẩn Tiến hành tương tự với toàn mẫu nghiên cứu, nghiên cứu thu hồ sơ ADN 13.396 mẫu 17 3.3 Tần suất alen tộc ngƣời nghiên cứu Đã xác định 11 bảng tần suất nhóm người Kinh (Bắc Trung, Nam) 08 tộc người có số dân đơng 3.3.1 Locus D8S1179 Khi nghiên cứu tần suất 09 tộc người, theo nhóm, vùng địa lý, phát 13 alen bao gồm alen 7, 8, 10, 11, 12, 13, 14, 15, 16, 17,18 alen 19 3.3.2 Locus D21S11 Trong nghiên cứu này, 18 alen thuộc locus D21S11 xác định bao gồm alen 19, 26, 27, 28, 28.2, 29, 29.2, 30, 30.2, 31, 31.2, 32, 32.2, 33, 33.2, 34, 34.2 alen 35.2 3.3.3 Locus D7S820 Thơng qua q trình phân tích mấu, phát 15 alen bao gồm alen 4, 6, 7, 8, 9, 9.1, 9.2, 10, 11, 12, 13, 14, 15, 23 alen 24 3.3.4 Locus CSF1PO Qua nghiên cứu phát 11 alen bao gồm alen 6, 7, 8, 9, 10, 10.2, 11, 12, 13, 14 15 3.3.5 Locus D3S1358 Đã phát 11 alen bao gồm alen 7, 10, 12, 13, 14, 15, 16, 17, 18, 19 alen 20 3.3.6 Locus TH01 Nghiên phát 11 alen bao gồm alen 5, 6, 6.3, 7, 8, 8.3, 9, 9.3, 10, 11 alen 12 3.3.7 Locus D13S317 Nghiên cứu 13.396 mẫu phát 10 alen bao gồm alen 7, 8, 9, 10, 11, 12, 13, 14, 15 alen 16 3.3.8 Locus D16S539 Nghiên cứu phát alen bao gồm alen 8, 9, 10, 11, 12,13, 14, 15 alen 19 18 3.3.9 Locus D2S1338 Ở locus D2S1338, thông qua nghiên cứu phát 17 alen bao gồm alen 13, 13.2, 14.2, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 alen 28 3.3.10 Locus D19S433 Trong nghiên cứu phát 16 alen bao gồm alen 9, 11, 12, 12.2, 13, 13.2, 14, 14.2, 15, 15.2, 16, 16.2, 17, 17.2, 18, 18.2, 3.3.11 Locus vWA Trong nghiên cứu phát 16 alen bao gồm alen 8, 10, 11,12, 13, 14, 15, 15.2, 16, 17, 18, 18.2, 19, 20, 21 alen 29 3.3.12 Locus TPOX Nghiên cứu phát alen bao gồm alen 7, 8, 9, 10, 11, 12, 13, 14 alen 15 3.3.13 Locus D18S51 Nghiên cứu phát 29 alen bao gồm alen số 5, 9, 9.2, 10, 11, 12, 12.2, 13, 13.2, 14, 14.2, 15, 15.2, 16, 16.2, 17, 18, 18.2, 19, 20, 20.2, 21, 21.2, 22, 23, 24, 25, 26 27 3.3.14 Locus D5S818 Tổng cộng 12 alen phát hiện, bao gồm alen số 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20 alen 23 3.3.15 Locus FGA Các alen phát bao gồm alen số 9, 10, 14, 16, 17, 18, 18.2, 19, 20, 20.2, 21, 21.2, 22, 22.2, 23, 23.2, 24, 24.2, 25, 25.2, 26, 26.2, 27, 27.2, 28, 28.2, 29, 29.2 alen 30.2 3.4 Tổng hợp alen locus thuộc tộc ngƣời nghiên cứu 3.5 Bảng tần suất alen đặc trƣng alen theo tộc ngƣời 3.5.1 Bảng tần suất alen tộc người 19 Trên sở kết điều tra tần suất alen tộc người nghiên cứu, tiến hành thống kê số lượng alen phát số alen thiếu khác với kít Identifiler Plus Sau tiến hành phân tích hồ sơ ADN toàn mẫu nghiên cứu, tập hợp phân tích xác định tần suất alen tộc người ta thu bảng tần suất ADN 09 tộc người (người Kinh, Tày, Thái, Mường, Khmer, Hoa, Nùng, H’mông Dao) 3.5.2 Các alen đặc trưng tộc người Những alen có tính đặc trưng cho tộc người alen đáp ứng tiêu chí sau: Xuất tộc người mà không thấy xuất tộc người khác Không xuất phổ biến tộc người, dù có tần suất thấp Xuất với tần suất cao tộc người lại thấy xuất với tần suất thấp nhiều tộc người lại Bảng 3.22 Thống kê alen đặc trưng tộc người Tộc Locus D8S1179 D21S11 D7S820 CSF1PO D3S1358 TH01 D13S317 D16S539 D2S1338 D19S433 vWA TPOX D18S51 D5S818 FGA Tổng Kinh Tày Thái Mường Khmer 26, 34 4, 23, 24 8, 29 5, 13.2 20 9, 10 17 Nùng H’mông Dao 14, 15 9.2 10 15, 16 18 26 17 18.2 8, 19 19 10.2 15 19 13.2, 14.2 Hoa 12 16 13 15.2 14, 15 9.2, 13.2 15.2, 26 16 29.2 14, 18.2 8 12 18.2 23 20.2 20 28.2 12 3.6 Các số đánh giá giám định ADN hình Bảng 3.23 Bảng tổng hợp giá trị khả phân biệt (PD) 15 locus tộc người nghiên cứu Tộc ngƣời Locus D8S1179 D21S11 D7S820 CSF1PO D3S1358 TH01 D13S317 D16S539 D2S1338 D19S433 vWA TPOX D18S51 D5S818 FGA KB KT KN TY TI MG KM HA NG HM DO Trung bình 0,96 0,948 0,911 0,88 0,885 0,878 0,923 0,918 0,969 0,948 0,918 0,77 0,959 0,911 0,966 0,965 0,945 0,907 0,89 0,867 0,89 0,923 0,913 0,972 0,948 0,928 0,8 0,967 0,926 0,975 0,964 0,948 0,921 0,885 0,873 0,909 0,931 0,92 0,964 0,944 0,926 0,779 0,965 0,928 0,971 0,957 0,946 0,905 0,881 0,874 0,865 0,921 0,905 0,966 0,942 0,917 0,758 0,967 0,921 0,971 0,958 0,944 0,914 0,874 0,881 0,839 0,912 0,912 0,971 0,956 0,931 0,748 0,963 0,914 0,965 0,96 0,957 0,918 0,879 0,861 0,9 0,916 0,901 0,969 0,95 0,921 0,735 0,958 0,922 0,971 0,954 0,935 0,92 0,856 0,872 0,901 0,922 0,916 0,961 0,953 0,934 0,767 0,96 0,901 0,969 0,96 0,938 0,915 0,873 0,879 0,877 0,913 0,917 0,966 0,933 0,928 0,806 0,964 0,919 0,971 0,972 0,956 0,933 0,863 0,909 0,914 0,926 0,908 0,977 0,96 0,942 0,853 0,973 0,949 0,976 0,931 0,951 0,862 0,781 0,853 0,843 0,829 0,88 0,934 0,94 0,892 0,773 0,946 0,901 0,957 0,961 0,938 0,858 0,868 0,874 0,851 0,914 0,897 0,964 0,943 0,916 0,77 0,964 0,917 0,966 0,958 0,946 0,906 0,866 0,875 0,879 0,912 0,908 0,965 0,947 0,923 0,778 0,962 0,919 0,969 Bảng 3.24 Bảng tổng hợp giá trị khả loại trừ (PE) 15 locus nghiên cứu tộc người Tộc ngƣời Locus D8S1179 D21S11 D7S820 CSF1PO D3S1358 TH01 D13S317 D16S539 D2S1338 D19S433 vWA TPOX D18S51 D5S818 FGA KB KT KN TY TI MG KM HA NG HM DO Trung bình 0,72 0,649 0,548 0,5 0,471 0,511 0,57 0,59 0,733 0,658 0,596 0,289 0,709 0,599 0,732 0,731 0,644 0,537 0,485 0,449 0,504 0,587 0,564 0,747 0,667 0,606 0,308 0,73 0,592 0,765 0,72 0,637 0,565 0,5 0,466 0,483 0,569 0,572 0,708 0,659 0,613 0,294 0,72 0,588 0,773 0,705 0,67 0,537 0,477 0,478 0,503 0,57 0,554 0,735 0,631 0,576 0,273 0,694 0,566 0,755 0,712 0,592 0,551 0,468 0,507 0,43 0,572 0,578 0,755 0,7 0,601 0,288 0,724 0,519 0,724 0,706 0,689 0,57 0,48 0,448 0,525 0,562 0,53 0,74 0,664 0,583 0,238 0,694 0,586 0,75 0,688 0,619 0,575 0,436 0,468 0,526 0,586 0,571 0,709 0,676 0,619 0,277 0,703 0,535 0,741 0,702 0,636 0,572 0,466 0,464 0,407 0,589 0,566 0,717 0,63 0,614 0,283 0,733 0,608 0,742 0,704 0,63 0,526 0,457 0,472 0,465 0,567 0,533 0,733 0,634 0,604 0,328 0,715 0,583 0,755 0,598 0,692 0,46 0,347 0,441 0,393 0,311 0,499 0,664 0,596 0,523 0,309 0,631 0,523 0,717 0,703 0,621 0,478 0,451 0,463 0,43 0,574 0,555 0,734 0,641 0,578 0,282 0,724 0,589 0,75 0,70 0,64 0,54 0,46 0,47 0,47 0,55 0,56 0,73 0,65 0,59 0,29 0,71 0,57 0,75 21 Bảng 3.26 Tổng hợp số xác định quan hệ huyết thống cha (PI) dựa vào tần suất alen tộc người Tộc ngƣời Locus KB KT KN TY D8S1179 D21S11 D7S820 CSF1PO D3S1358 TH01 D13S317 D16S539 D2S1338 D19S433 vWA TPOX D18S51 D5S818 FGA 3,37 2,87 2,07 1,75 1,85 1,78 2,03 2,29 3,69 2,77 2,31 1,21 3,39 2,23 3,76 5,07 3,43 2,28 1,8 1,99 1,85 2,32 2,32 3,61 2,54 2,36 1,26 3,19 2,21 5,96 3,64 3,57 2,33 1,63 1,72 1,73 2,19 1,98 3,25 2,56 2,64 1,23 3,96 2,12 3,19 3,38 2,73 2,03 1,87 1,82 2,25 2,22 3,43 2,57 2,46 1,25 3,99 2,35 4,06 TI MG KM HA NG HM DO 3,21 2,49 1,82 1,77 2,03 1,58 1,89 2,37 3,63 2,68 2,31 1,11 3,81 2,14 3,56 3,36 3,14 2,23 1,81 1,72 2,18 2,03 3,79 2,89 2,31 1,09 3,21 2,35 3,94 3,16 2,54 2,26 1,66 1,78 2,01 2,34 2,26 3,38 3,01 2,56 1,17 3,29 2,07 3,82 3,27 3,27 2,67 1,6 1,53 1,76 2,4 5,54 2,18 2,18 1,5 3,43 3,43 3,4 2,76 1,94 2,1 2,08 1,7 2,1 1,87 4,16 2,76 2,96 1,2 3,05 2,27 3,24 2,38 3,11 1,6 1,27 1,62 1,56 1,18 1,52 2,82 2,71 2,04 1,21 3,5 2,1 3,33 2,53 1,7 2,15 1,7 1,58 1,93 2,48 3,46 3,35 1,81 1,25 3,8 2,33 2,85 Trung bình 3,39 2,95 2,08 1,76 1,82 1,78 2,02 2,16 3,7 2,73 2,36 1,22 3,51 2,2 3,74 3.7 Cây phát sinh chủng loại tộc ngƣời 3.7.1 Khoảng cách di truyền phát sinh chủng loại nhóm người Kinh thuộc vùng địa lý lãnh thổ Việt Nam Trong chủng loại phát sinh, nhóm người Kinh miền Nam tách so với nhóm người Kinh miền Bắc miền Trung, giá trị khoảng cách di truyền nhỏ, đó, tần suất alen hệ Identifiler người Kinh sử dụng chung cho ba miền Bắc, Trung, Nam 3.7.2 Khoảng cách di truyền phát sinh chủng loại nhóm người Kinh miền Bắc số nhóm tộc người vùng núi phía Bắc Việt Nam Kết cho thấy : nhóm lớn gồm người Kinh, Mường, Tày, Nùng Thái Trong nhóm này, người Kinh gần với người Mường sau hợp nhóm với người Tày, người Thái gần với người Nùng Người H’mơng người Dao lập thành nhóm riêng tách biệt so với nhóm kể 22 3.7.3 Khoảng cách di truyền phát sinh chủng loại nhóm người Kinh, người Khmer người Hoa khu vực Nam Việt Nam Kết cho thấy: Người Khmer người Hoa tách thành hai nhóm riêng biệt so với người Kinh khu vực miền Nam Việt Nam, tộc người chủ yếu cư trú khu vực Nam 3.7.4 Khoảng cách di truyền phát sinh chủng loại tộc người nghiên cứu phân theo khu vực địa lý Kết cho thấy : nhóm người có tộc người, du sống khu vực khác đất nước Việt Nam có nguồn gốc gần giũi Nhóm H’mơng có khoảng cách di truyền lớn so với nhóm khác Nhánh thứ hai nhánh dân tộc Dao Các dân tộc cịn lại, chia làm 04 nhóm gần gũi gần gũi với tộc người Kinh miền Tổ quốc Bao gồm : Nhóm tộc người Kinh, tộc người Mường Khmer, nhóm 2: Nhóm tộc người Thái tộc người Hoa Tộc người Tày tộc người Nùng tách thành 02 nhóm riêng 3.8 Bảng tính ứng dụng tần suất quần thể Việc tính tốn dựa vào cơng thức tốn xác suất thống kê quy định giám định ADN theo định luật di truyền quần thể dựa vào tần suất alen bắt buộc để đưa kết luận giám định ADN Việc đưa cơng thức tốn học vào bảng tính, phần mềm giúp cho giám định viên tính tốn nhanh có kết xác cao 3.8.1 Cơng thức tính tốn Tính tốn theo cơng thức sử dụng khoa học hình trường hợp truy nguyên cá thể quan hệ huyết thống 23 BÀN LUẬN CHUNG Thơng qua phân tích ADN kít Identifiler Plus 13.396 mẫu máu 09 tộc người, khơng có quan hệ huyết thống gần gũi nhau, mẫu thu toàn lãnh thổ Việt Nam Kết phân tích thu 13.396 hồ sơ ADN tất mẫu Từ việc nghiên cứu trên, đưa số bàn luận chung sau: Thứ nhất: Việc thu mẫu giấy FTA card mẫu máu phù hợp với điều kiện Viêt Nam Số lượng mẫu thu 150 mẫu cho dân tộc đạt yêu cầu mức độ tối thiểu Thứ hai: việc tách chiết ADN từ mẫu giấy FTA thu mẫu phương pháp tách chiết sử dụng kít tách chiết ADN Prefiler phù hợp trường hợp sử dụng hệ thống robot tách chiết tự động với số lượng mẫu lớn, mã hóa Thứ ba: thơng qua kiểm định giả thiết thống kê χ2 tồn tần suất alen tộc người phù hợp với giả thuyết thống kê, phần bố tần suất alen ngẫu nhiên Thứ tư: thông qua việc sử dụng bảng tính Excel để tính tốn tần suất alen locus hệ Identifiler, đồng thời tính tốn đưa kết số khoa học hình chủ yêu đạt yêu cầu giám định ADN Tần suất alen locus tộc người khác sai khác có ý nghĩa, nhóm người tộc người địa bàn khác ln có khoảng cách di truyền nhỏ Có thể có alen mang tính đặc trưng tộc người, điều cần phải có nghiên cứu sâu thêm để khằng định Tuy nhiên, khơng có sở khoa học dựa vào hồ sơ ADN mẫu để khẳng định mẫu mẫu người thuộc tộc người Thứ năm: khoảng cách di truyền 09 tộc người có số dân đơng khơng lớn Trên sở tính khoảng cách di truyền (D) lập phát sinh chủng loại cho thấy người Kinh ba miền Bắc, Trung, Nam sai khác không ý nghĩa 24 Các tộc người Mường, Tày, Nùng thành nhóm có quan hệ gần với người Kinh Người Khmer người Hoa có khoảng cách di truyền xa Tộc người H’mông Dao tách thành hai nhóm riêng có khoảng cách di truyền xa xa tộc người khác Thứ sáu: Qua vụ án thực tế cho thấy khơng có bảng tần suất alen 15 locus gen phân tích kít Identifiler tộc người Việt Nam, không đưa kết luận xác Trong trường hợp chưa biết rõ, nên áp dụng tần suất alen tộc người Kinh làm giá trị tham khảo Dựa vào bảng tần suất alen, xây dựng bảng tính để tính tốn giúp cho việc tính tốn nhanh xác KẾT LUẬN Trên sở phân tích tính tần suất alen 15 locus STR (D8S1179, D21S11, D7S820, CSF1PO, D3S1358, TH01, D13S317, D16S539, D2S1338, D19S433, vWA, TPOX, D18S51 D5S818 FGA) tộc người (Kinh, Tày, Thái, Mường, Khmer, Hoa, Nùng, H’mông, Dao) kết luận sau: 15 locus STR nghiên cứu mang tính đa hình di truyền khác nhau, có 54 alen tần suất thấp alen chưa có thang alen chuẩn quốc tế Đã xác định tần suất alen tần suất dị hợp, khả phân biệt (PD), khả loại trừ (PE) số xác định huyết thống locus STR tộc người nghiên cứu đủ điều kiện áp dụng cho giám định ADN với mục đích truy nguyên cá thể xác định huyết thống trực hệ Các alen locus có tính đặc trưng dân tộc alen xuất tộc người mà không thấy xuất tộc người khác xuất với tần suất cao tộc người lại thấy xuất với tần suất thấp nhiều tộc người lại, 53 alen 09 tộc người đáp ứng yêu cầu kể 25 Trên sở tính khoảng cách di truyền (D) lập phát sinh chủng loại cho thấy người Kinh ba miền Bắc, Trung, Nam người Kinh 07 vùng lãnh thổ Việt Nam sai khác mặt di truyền hệ Identifiler không ý nghĩa Các tộc người Mường, Tày, Nùng thành nhóm có quan hệ gần với người Kinh Người Khmer người Hoa có khoảng cách di truyền xa Tộc người H’mông Dao tách thành hai nhóm riêng tách biệt nhóm khác Các locus có khả phân biệt cao FGA, D2S1338, D18S51, D8S1179, D19S433, D21S11 ứng dụng để chế tạo kít giám định có độ xác cao cho truy nguyên cá thể xác định huyết thống Cơng cụ tính tồn bảng tính Excel xác định quan hệ huyết thống truy nguyên cá thể áp dụng giám định ADN cho lực lượng kỹ thuật hình tồn quốc KIẾN NGHỊ Có thể ứng dụng bảng tần suất alen tộc người để tính xác suất kết luận giám định lực lượng kỹ thuật hình Cơng an nhân dân Khơng xác định nguồn gốc tộc người dựa vào hồ sơ ADN phân tích từ mẫu cá thể đó, định hướng cho q trình điều tra Một số alen có tần suất thấp đặc trưng cho tộc người cộng đồng tộc người Việt Nam cần tiếp tục nghiên cứu Tăng thêm số mẫu tộc người nghiên cứu đồng thời mở rộng nghiên cứu xác định tần suất tộc người có số dân đơng ngồi danh sách 09 tộc người nghiên cứu tộc người Gia Rai, Ê Đê Ba Na Các locus: FGA, D2S1338, D18S51, D8S1179, D19S433, D21S11 cần lưu ý giám định sinh học pháp lý locus có khả phân biệt với độ tin cậy cao 26 DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN Nguyễn Quang Vinh, Trịnh Tuấn Toàn, Phan Diệu Linh, Phạm Quang Khải, Nguyễn Thị Thanh Nga, Nguyễn Quang Huy (2014), "Xác định alen 9.1 locus D7S820 ADN người Việt kit Identifiler Plus", Tạp chí Khoa học Khoa học Tự nhiên Công nghệ T.30(6S), tr 618-625 Trịnh Tuấn Toàn, Phạm Ngọc Sơn, Đỗ Hoài Nam, Lê Thanh Cừ, Lương Thị Phúc, Nguyễn Quang Huy, Trịnh Hồng Thái (2015), "Tần suất alen STR 15 locus gen hệ IdentifilerTM quần thể người Tày người Khmer Nam Bộ", Tạp chí Khoa học - Khoa học Tự nhiên Công nghệ T.31(4S), tr 437444 Trịnh Tuấn Toàn, Hà Quốc Khanh, Vũ Lê Lợi, Nguyễn Quang Vinh, Nguyễn Quang Huy (2017), "Nghiên cứu đa dạng haplotype Y- STR quần thể ngẫu nhiên người Kinh Việt Nam", Tạp chí Khoa học - Khoa học Tự nhiên Công nghệ T.33(2S), tr 212-218 Trịnh Tuấn Toàn, Hà Quốc Khanh, Nguyễn Văn Huy, Nguyễn Quang Huy (2018), Tần suất alen locus STR hệ Powerplex Fusion quần thể người Kinh (Việt Nam), Báo cáo khoa học Hội nghị khoa học Công nghệ sinh học toàn quốc 2018, ISBN 978-604-913-759-4, tr 133-137 27 ... thổ Việt Nam cấp bách, tiến hành thực đề tài : " Nghiên cứu đặc trưng tần suất allen hệ nhận dạng số tộc người Việt Nam để phục vụ ứng dụng giám định sinh học pháp lý" Mục tiêu nghiên cứu luận án. .. nghiên cứu Tăng thêm số mẫu tộc người nghiên cứu đồng thời mở rộng nghiên cứu xác định tần suất tộc người có số dân đơng ngồi danh sách 09 tộc người nghiên cứu tộc người Gia Rai, Ê Đê Ba Na Các. .. Xác định tính đặc trưng tần suất alen tộc người dựa vào phân bố tần suất alen kít AmpFlSTR® Identifiler® Plus đánh giá alen có tần suất cao, alen có tần suất thấp tộc người, alen đặc trưng tộc người