Nhan đề : Nghiên cứu tần suất alen 2 locus đa hình STR ở quần thể người Kinh Việt Nam Tác giả : Đỗ Thị Xao Mai Người hướng dẫn: Trương Quốc Phong Từ khoá : Short tandem repeat; ADN; Việt Nam Năm xuất bản : 2020 Nhà xuất bản : Trường đại học Bách Khoa Hà Nội Tóm tắt : Tổng quan về tần suất alen, STR, Alen, locus gen; vật liệu và phương pháp nghiên cứu; kết quả nghiên cứu và thảo luận.
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SĨ
Nghiên cứu tần suất alen 21 locus đa hình STR
ở quần thể người Kinh Việt Nam
ĐỖ THỊ XAO MAI Ngành: Công nghệ sinh học
Giảng viên hướng dẫn: PGS TS Trương Quốc Phong
TS Nguyễn Văn Lợi
Viện: Công nghệ sinh học và Công nghệ thực phẩm
HÀ NỘI, 2020
Trang 2TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SĨ
Nghiên cứu tần suất alen 21 locus đa hình STR
ở quần thể người Kinh Việt Nam
ĐỖ THỊ XAO MAI Ngành: Công nghệ sinh học
Giảng viên hướng dẫn: PGS TS Trương Quốc Phong
TS Nguyễn Văn Lợi
Viện: Công nghệ sinh học và Công nghệ thực phẩm
Chữ ký của GVHD
Trang 3CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ
Họ và tên tác giả luận văn: Đỗ Thị Xao Mai
Đề tài luận văn: Nghiên cứu tần suất alen 21 locus đa hình STR ở quần
thể người Kinh Việt Nam
Chuyên ngành: Công nghệ sinh học
Mã số SV: CA180119
Tác giả, Người hướng dẫn khoa học và Hội đồng chấm luận văn xác nhận tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày 30/10/2020 với các nội dung sau:
- Chỉnh sửa các lỗi chính tả, thiếu chữ viết tắt
- Trình bày cho rõ ràng
- Viết lại tài liệu tham khảo theo tiêu chuẩn
- Chỉnh sửa bố cục, nội dung luận văn cho hợp lý
Ngày tháng năm 2020 Giáo viên hướng dẫn Tác giả luận văn
CHỦ TỊCH HỘI ĐỒNG
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan những nội dung viết trong luận văn là do sự tìm tòi, học hỏi và nghiên cứu của bản thân với sự hướng dẫn tận tình của PGS TS Trương Quốc Phong và TS Nguyễn Văn Lợi
Mọi kết quả nghiên cứu cũng như ý tưởng của các tác giả khác (nếu có) đều được trích dẫn cụ thể Đề tài luận văn này cho đến nay chưa được bảo vệ tại bất kỳ một hội đồng bảo vệ luận văn thạc sĩ nào và cũng chưa được công bố trên bất kỳ phương tiện nào Tôi xin chịu trách nhiệm về những lời cam đoan trên
Trang 5LỜI CẢM ƠN
Với tấm lòng kính trọng và sự biết ơn chân thành nhất, em xin cảm ơn PGS TS Trương Quốc Phong và TS Nguyễn Văn Lợi đã tận tình hướng dẫn em trong quá trình nghiên cứu để em hoàn thành luận văn này
Em xin chân thành cảm ơn Lãnh đạo, Chỉ huy Viện Pháp y Quân đội đã tin tưởng giao đề tài và quan tâm, tạo điều kiện giúp đỡ em trong quá trình công tác, học tập và nghiên cứu đề tài
Cuối cùng em xin cảm ơn tâp thể cán bộ, nhân viên Khoa Xét nghiệm - Viện Pháp y Quân đội đã tạo điều kiện thuận lợi cho em trong suốt quá trình học tập và hoàn thành luận văn
Hà Nội, tháng 10 năm 2020
Học viên
Đỗ Thị Xao Mai
Trang 6M ỤC LỤC
M ỤC LỤC i
ĐẶT VẤN ĐỀ 1
CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 4
1.1 Tổng quan về tần suất alen 4
1.1.1 Tần suất alen là gì 4
1.1.2 Tầm quan trọng của việc nghiên cứu tần suất alen 5
1.2 Tổng quan về STR, Alen, locus gen 6
1.2.1 STR ( Short tandem repeat) là gì 6
1.2.2 Alen là gì 8
1.2.3 Locus là gì 8
1.3 Tình hình nghiên cứu trong và ngoài nước 9
1.3.1 Tình hình nghiên cứu trong nước 9
1.3.2 Tình hình nghiên cứu trên thế giới .10
CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 12
2.1 Vật liệu nghiên cứu .12
2.1.1 Đối tượng nghiên cứu 12
2.1.2 Hóa chất, thiết bị sử dụng trong nghiên cứu .12
2.1.3 Đặc điểm của bộ kit GlobalFiler™ PCR Amplification Kit 14
2.2 Phương pháp nghiên cứu 20
2.2.1 Phương pháp thu mẫu: 20
2.2.2 Phương pháp phân tích mẫu .21
2.2.3 Phân tích xử lí số liệu và tính toán tần suất alen 29
CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN 34
3.1 Kết quả phân tích mẫu .34
3.2 Kết quả phân tích thống kê 37
3.2.1 Kết quả tính tần số alen của 21 locus .37
3.2.2 Xác định và liệt kê các alen có tần số thấp 41
Trang 73.2.4 Kết quả tính toán và so sánh các chỉ số pháp y 43
3.2.5 Giá trị tổ hợp của các chỉ số pháp y 47
3.3 So sánh tần suất các alen của quần thể nghiên cứu với một số nghiên cứu khác 47
3.3.1 Tần số alen của locus D3S1358 47
3.3.2 Tần số alen của locus vWA 48
3.3.3 Tần số alen của locus D16S539 49
3.3.4 Tần số alen của locus CSF1PO 50
3.3.5 Tần số alen của locus TPOX 51
3.3.6 Tần số alen của locus D8S1179 52
3.3.7 Tần số alen của locus D21S11 53
3.3.8 Tần số alen của locus D18S51 55
3.3.9 Tần số alen của locus D2S441 56
3.3.10 Tần số alen của locus D19S433 57
3.3.11 Tần số alen của locus TH01 58
3.3.12 Tần số alen của locus FGA 59
3.3.13 Tần số alen của locus D22S1045 61
3.3.14 Tần số alen của locus D5S818 62
3.3.15 Tần số alen của locus D13S317 63
3.3.16 Tần số alen của locus D7S820 64
3.3.17 Tần số alen của locus SE33 65
3.3.18 Tần số alen của locus D10S1248 67
3.3.19 Tần số alen của locus D1S1656 68
3.3.20 Tần số alen của locus D12S391 69
3.3.21 Tần số alen của locus D2S1338 71
CHƯƠNG 4 KẾT LUẬN VÀ KIẾN NGHỊ 72
TÀI LI ỆU THAM KHẢO 74
PH Ụ LỤC 77
Trang 8DANH M ỤC HÌNH VẼ
Hình 1.1 Locus TH01 của 01 cá thể 7
Hình 1.2 Các locus trên một nhiễm sắc thể 8
Hình 1.3 V ị trí của 13 Locus trong CoDis trên NST 9
Hình 3.1 Ki ểu gen trên 24 locus của mẫu HT105.19_2 35
Hình 3.2 Biểu đồ cột theo giá trị chỉ số PM của từng locus 45
Hình 3.3 Biểu đồ cột theo giá trị chỉ số PD của từng locus 45
Hình 3.4 Bi ểu đồ cột theo giá trị chỉ số PE của từng locus 46
Trang 9DANH M ỤC BẢNG BIỂU
B ảng 2.1 Các locus và alen của bộ kit GlobalFiler™ 17
Bảng 3.1 Kiểu gen của mẫu HT105.19_2 trên 24 locus 36
Bảng 3.2 Tần suất alen 21 Locus STR trong quần thể người Kinh Việt Nam 38
B ảng 3.3 Các alen có tần số thấp trong quần thể nghiên cứu 41
B ảng 3.4 Tần số dị hợp tử quan sát (OH) và tần số dị hợp tử lý thuyết(EH) 42
Bảng 3.5 Kết quả tính toán các chỉ số Pháp y 43
Bảng 3.6 Tần số alen của locus D3S1358 48
B ảng 3.7 Tần số alen của locus vWA 49
B ảng 3.8 Tần số alen của locus D16S539 50
Bảng 3.9 Tần số alen của locus CSF1PO 51
B ảng 3.10 Tần số alen của locus TPOX 52
B ảng 3.11 Tần số alen của locus D8S1179 53
Bảng 3.12 Tần số alen của locus D21S11 54
Bảng 3.13 Tần số alen của locus D18S51 55
B ảng 3.14 Tần số alen của locus D2S441 56
B ảng 3.15 Tần số alen của locus D19S433 57
Bảng 3.16 Tần số alen của locus TH01 59
Bảng 3.17 Tần số alen của locus FGA 60
B ảng 3.18 Tần số alen của locus D22S1045 62
B ảng 3.19 Tần số alen của locus D5S818 63
Bảng 3.20 Tần số alen của locus D13S317 64
Bảng 3.21 Tần số alen của locus D7S820 65
B ảng 3.22 Tần số alen của locus SE33 66
B ảng 3.23 Tần số alen của locus D10S1248 68
Bảng 3.24 Tần số alen của locus D1S1656 69
Bảng 3.25 Tần số alen của locus D12S391 70
B ảng 3.26 Tần số alen của locus D2S1338 71
Trang 10
DANH M ỤC VIẾT TẮT
Ch ữ viết tắt N ội dung
ADN Deoxyribonucleic acid
FTA Giấy thu mẫu máu
NST nhiễm sắc thể
STR Short tandem repeat
PCR Polymerase chain reaction
CPM Combinded Match probability
CPE Combinded Power of Exclusion
CPD Combinded Power of discrimination
PBS Phosphate - Buffered Saline
SDS Sodium dodecyl sulfate
DDT Dithiothreitol
Trang 12ĐẶT VẤN ĐỀ
Năm 2020 sắp qua và chúng ta đã được chứng kiến sự phát triển vượt bậc
của khoa học công nghệ Mặc dù sự phát triển này đem lại rất nhiều lợi ích cho loài người, tuy nhiên sự phát triển quá nhanh cũng đem lại nhiều vấn đề khiến chúng ta phải lo lắng
Mỗi năm trên thế giới có hàng ngàn vụ thảm họa thiên tai, hàng triệu vụ án
mạng, mất tích, khủng bố quy mô rộng Trong bất kỳ một trường hợp nào, ở bất cứ
quốc gia nào thì việc xác định rõ tung tích nạn nhân là vấn đề đầu tiên đặt ra cần
giải quyết Khoa học hiện đại với công nghệ ADN làm mũi nhọn đã tiến tới khả năng nhận biết truy nguyên đến mức độ cá thể bằng chính những thông tin được
mã hóa trong hệ gen của mỗi người Trong những năm gần đây, thế giới đã chứng
kiến những vụ thảm họa lớn xảy ra như vụ khủng bố vào tòa tháp đôi ở Trung tâm thương mại thế giới tại New York ngày 11 tháng 9, vụ thảm họa sóng thần ở khu
vực Đông Nam Á, những vụ tai nạn máy bay, những vụ đánh bom liều chết cướp
đi sinh mạng của hàng trăm người… Trong rất nhiều trường hợp ADN được coi như là dấu vết và bằng chứng đưa đến những kết luận cuối cùng
Việc ứng dụng kỹ thuật phân tích ADN đã giúp ích rất nhiều cho việc điều tra phá án, đồng thời cho phép truy nguyên cá thể với độ chính xác cao hơn hẳn các phương pháp nhận dạng truyền thống Dấu vết sinh phẩm thu được ở hiện trường của các vụ án thường là rất ít hoặc bị phân hủy nghiêm trọng nhưng thông qua phân tích ADN có thể cho chúng ta những chứng cứ quan trọng giúp truy nguyên thủ phạm của vụ án hoặc truy tìm tung tích nạn nhân một cách chính xác [1]
Một marker chỉ thị, hay một locus ADN nhân mang tính khoa học được sử
dụng (được coi là đặc trưng cá thể) nếu nó có nhiều alen khác nhau trong quần thể (nhiều hơn 5 alen) và kiểu gen dị hợp của các cá thể trong quần thể lớn hơn 70% [1] [2] Do đó, càng nhiều vị trí ADN (locus ADN) được phân tích để tìm đặc trưng ADN, thì khả năng xác định mẫu sinh học nào đó của một người càng cao
Vì thế, việc xác định đặc trưng cá thể về phương diện ADN giữa mẫu sinh phẩm
Trang 13thu được và mẫu sinh phẩm đối chứng của một cá thể nghi ngờ hoặc với ngân hàng
dữ liệu ADN (nếu có) là cực kỳ quan trọng
Hiện nay, trên thế giới công tác giám định pháp y, đặc biệt là trong khoa
học hình sự chủ yếu sử dụng các marker STR (Short Tandem Repeat), đây là các đoạn ADN có cấu trúc lặp lại từ 2-6 bp, có tính bảo thủ cao, được di truyền qua các thế hệ và mang tính đặc trưng cá thể Một locus STR được sử dụng cho mục đích nhận dạng và xác định cá thể phải có tính đa hình và mức độ dị hợp tử cao, có kích thước ngắn từ 100-500bp và phải có tính di truyền độc lập [2] Trên thực tế,
tần suất xuất hiện các Alen của locus STR trong quần thể ở các nước khác nhau, các tộc người khác nhau cũng có sự khác biệt Có những Alen chỉ thấy xuất hiện ở
tộc người này nhưng lại không thấy xuất hiện ở tộc người khác hoặc rất hiếm gặp [3] Vì thế, việc nghiên cứu tần suất alen của các tộc người khác nhau có ý nghĩa quan trọng trong việc đánh giá và áp dụng có hiệu quả thông qua phân tích các locus STR, giúp truy nguyên cá thể một cách nhanh chóng, chính xác [4]
Ở Việt Nam, việc nghiên cứu ứng dụng kỹ thuật phân tích STR trong nhận
dạng cá thể người cũng đã được phát triển mạnh mẽ từ những năm 2000 đến nay,
hầu hết các phòng thí nghiệm đều đang sử dụng các bộ kit marker STR để xác định quan hệ huyết thống, nhận dạng người Trước đây tại các phòng thí nghiệm ở Việt Nam thường chỉ sử dụng bộ kit nhân gen 16 locus thì bây giờ khoa học công nghệ phát triển đã cho ra các bộ kit nhân gen 24 locus, cho độ nhậy và độ chính xác cao hơn
Tại Khoa xét nghiệm - Viện Pháp Y Quân đội, hiện đang sử dụng bộ kit nhân gen Global filer 24 locus Hàng năm chúng tôi tiếp nhận và giải quyết hàng trăm vụ án: cướp của, giết người, hiếp dâm, nhận dạng các nạn nhân của các vụ
thảm họa như: vụ rơi máy bay Mi 171, vụ rơi máy bay CaSa Hầu hết dấu vết trong các vụ án cướp của, giết người, hiếp dâm thường rất nghèo nàn, nhiều mẫu
bị phân hủy không có khả năng phân tích đủ 24 locus trong nhận dạng Do đó để đánh giá độ chính xác hay mức độ tin cậy của xét nghiệm này cần có các thống kê
cụ thể về tần suất alen, tần suất dị hợp tử của từng locus STR đối với người Việt Nam Từ đó tính toán khả năng phân biệt của từng locus, độ chính xác cũng như
độ tin cậy của phép phân tích trong từng trường hợp cụ thể
Trang 14Mặt khác hiện nay ở Việt Nam chỉ có bảng tần suất alen của 15 locus hệ Identifiler, powerplex 16 , tần suất alen của hệ Power plex Fusion System Cho đến nay, chưa có một nghiên cứu nào được công bố về khảo sát sự phân bố tần
suất các alen của các locus gen hệ Globalfiler (gồm 24 locus gen) trong quần thể người Kinh Theo Tổng điều tra dân số và nhà ở năm 2019, người Kinh ở Việt Nam có dân số 82.085.826 người, chiếm 85.3% dân số cả nước, cư trú tại tất cả
63 tỉnh, thành phố Các tỉnh, thành phố có số lượng người Kinh lớn nhất là: Thành
phố Hồ Chí Minh, Hà Nội, Thanh Hóa, Nghệ An, Đồng Nai, An Giang [5] đây
là những điểm nóng về tình hình an ninh và trật tự xã hội, số vụ án trong cộng đồng người Kinh có diễn biến phức tạp với xu hướng ngày càng gia tăng Các vụ
án về nhận dạng, truy nguyên cá thể trên quần thể người Kinh cũng phổ biến nhất
Xuất phát từ những yêu cầu thực tiễn chúng tôi đã chọn đề tài nghiên cứu:
" Nghiên c ứu tần suất alen 21 locus đa hình STR ở quần thể người Kinh Việt Nam"; với các mục tiêu sau:
1 Xây dựng bộ số liệu tần suất alen của 21 locus đa hình STR của quần thể người Kinh Việt Nam
2 Đánh giá các chỉ số thống kê đặc trưng của tần suất alen, chỉ số đa dạng
di truyền quần thể
3 So sánh đối chiếu với tần suất tương ứng ở một số nước trong khu vực và trên thế giới Đánh giá khả năng phân biệt của chúng trong nhận dạng cá thể
Trang 15CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 1.1 Tổng quan về tần suất alen
1.1.1 Tần suất alen là gì
Tần suất alen được hiểu là tỉ lệ xuất hiện của một alen nào đó trong quần thể
ở một locus gen trên nhiễm sắc thể [6] Tần suất alen được tính bằng số lần alen được quan sát thấy trong quần thể trên tổng số alen của locus cụ thể nào đó trong
quần thể Tần suất alen có thể được thể hiện dưới dạng số thập phân, phần trăm
hoặc phân số Trong một quần thể tần suất alen phản ánh sự đa dạng di truyền
Hiện nay, trong phân tích ADN có đến hàng chục locus gen được chế tạo và
sử dụng ở dạng bộ Kit thương phẩm bán trên thị trường thế giới; các locus gen này
nằm trên các nhiễm sắc thể khác nhau từ cặp số 1 đến cặp số 23 Các nhà nghiên
cứu ADN thường sử dụng những locus gen khác nhau trên những nhiễm sắc thể khác nhau để bảo đảm tính phân ly độc lập và tính đa hình cao Các hãng sản xuất trên thế giới ngày nay thường cho ra đời các bộ Kit phân tích ADN bao gồm nhiều gen khác nhau; phổ biến là Kit của hãng Appliedbiosystem: Profiler plus 10 gen, Codis 13 gen, Identifiler GlobalFiler 24 gen và có thể mở rộng thêm số locus gen nhiều hơn nữa Thêm vào đó trong mỗi locus gen lại có nhiều alen khác nhau (alen
là những trạng thái biểu hiện khác nhau của một gen chiếm một vị trí xác định trên nhiễm sắc thể) Do vậy sẽ có rất nhiều đặc điểm khác nhau được phân tích
Để xác định được tần suất alen các nhà nghiên cứu về ADN đã phải nghiên
cứu, khảo sát và công bố kết quả về một gen hoặc nhiều gen thuộc một số tộc người nhất định trên thế giới trong đó có cả tần suất của các alen Sở dĩ phải như
vậy là để xác định tính đa hình của gen đó, sự khác biệt giữa tộc người này với tộc người khác; gen có bị đột biến hay không, tỷ lệ đột biến cao hay thấp…Để từ đó quyết định có nên sử dụng gen đó hay không Muốn xác định được tần suất alen
cần phải thu thập được mẫu, mẫu này là của những người đã biết chính xác về nguồn gốc (tộc người, không có quan hệ họ hàng huyết thống với những mẫu khác,
ở nhiều vùng địa lý khác nhau trong mỗi quốc gia) Số lượng các mẫu cần phân tích phải đủ lớn để bảo đảm được độ tin cậy cao, có nghĩa là kết quả phân tích
thống kê tần số alen và kiểu gen phải phù hợp giữa mẫu nghiên cứu và quần thể lý thuyết, và sử dụng tiêu chuẩn Khi bình phương (Chi square) để thẩm định Chỉ khi
Trang 16nào đạt được tiêu chuẩn này thì tần suất alen đó mới có giá trị [7] Khi có được số
liệu tần suất alen của các gen thì tần suất này được sử dụng để xác định độ tin cậy trong truy nguyên cá thể và xác định quan hệ huyết thống Hiện nay chỉ duy nhất
bộ kit Globalfiler 24 locus gen của hãng Appliedbiosystem là được Viện Pháp y Quân đội xác định tần suất và áp dụng cho hệ gen người Việt để giám định ADN truy nguyên cá thể hay xác định huyết thống
1.1.2 Tầm quan trọng của việc nghiên cứu tần suất alen
Một bảng gồm các giá trị tương đối của các alen của từng locus trong một
quần thể cụ thể được gọi là một cơ sở dữ liệu tần suất STR.[8]
Các cơ sở dữ liệu tần suất STR của một quần thể người được xây dựng cho
việc đánh giá và phân tích Dựa trên các cơ sở dữ liệu có thể truy xuất từ một bộ
hồ sơ ADN của một người nào đó về thông tin nguồn gốc, chủng tộc của người này Một cơ sở dữ liệu phải được xây dựng trên một kích thước mẫu đủ lớn nhằm đảm bảo giảm sai số do kích thước mẫu Mục đích lớn nhất của việc xây dựng cơ
sở dữ liệu nhằm tạo dựng bộ thông tin di truyền của một quần thể về các alen phổ
biến trong quần thể đó [9], [10]
Mỗi cá thể người có cấu trúc di truyền riêng không ai giống ai, trừ những trường hợp sinh ra cùng một trứng Nếu xét rộng trong cả một quần thể thì một số đặc điểm di truyền - ADN ở các cá thể khác nhau vẫn có thể giống nhau [11] Mặt khác mỗi một quần thể người khác nhau cũng có những đặc điểm di truyền đặc trưng thể hiện bằng sự phân bố tần suất alen trong mỗi quần thể [12], [13] Do vậy, trong giám định ADN các nhà khoa học hình sự ngoài lựa chọn, nghiên cứu những locus có tính đa alen cao thì cần khảo sát tần suất phân bố các alen trong quần thể
của từng locus để sử dụng trong tính toán và kết luận giám định Quần thể được nghiên cứu khảo sát phải đạt được các yêu cầu trong thống kê, di truyền như: các
mẫu dùng trong nghiên cứu phải đảm bảotính ngẫu nhiên, không có quan hệ huyết
thống trong 3 đời [14], [15]
Để có được tần suất của mỗi alen, trước hết phải tìm được số lần xuất hiện
của mỗi alen trong quần thể nghiên cứu sau đó tính tần suất lý thuyết của alen đó theo định luật di truyền quần thể [16] Khi có được tần suất thực tế và tần suất lý
Trang 17nhận với mức xác suất đã chọn Giám định gen (ADN) đòi hỏi cơ sở khoa học
vững chắc để tính toán xác suất một người ngẫu nhiên trong quần thể là người có
cấu trúc di truyền đặc trưng trùng lặp với ADN trong các mẫu vật, dấu vết thu thập trong quá trình điều tra
Nếu không có tần suất alen thì không tính toán được tần suất xuất hiện của
một kiểu gen nào đó trong một quần thể nhất định, đó cũng là cơ sở khoa học để so sánh độ tin cậy trong trường hợp phân tích được nhiều locus gen hoặc ít locus gen hơn [16], [17]
1.2 Tổng quan về STR, Alen, locus gen
1.2.1 STR ( Short tandem repeat) là gì
STR là đoạn trình tự đa hình nằm trong vùng không mã hóa, có cấu trúc gồm các đoạn lặp lại của một trình tự nucleotit có độ dài khoảng 2 – 6 bp, chiếm khoảng 3% hệ gen người Do nằm ngoài vùng mã hóa, các STR rất đa dạng giữa người với người về độ dài có thể lên đến hàng nghìn base, trình tự đoạn lặp mà không ảnh hưởng đến hoạt động sinh học của tế bào Các đoạn lặp lại này nằm rải rác ở khắp nơi trong hệ gen của người Từ những năm 1990 đến nay đã có hàng
chục nghìn STR trên các nhiễm sắc thể (NST) được phát hiện [18], [19]
Các cấu trúc STR đều mang tính bảo thủ cao, được di truyền qua các thế hệ
và mang tính đặc trưng cho cá thể Các gen này thường có tính đa hình cao, ít đột
biến, tương đối bền vững và cho phép đồng thời thực hiện được phản ứng nhân gen của nhiều gen khác nhau [1], [2], [3], [4] Dựa trên tính đa hình của các cấu trúc STR về chiều dài: Một số gốc nucleotid được lặp đi lặp lại nhiều lần trên chiều dài của đoạn ADN
Ví d ụ: tại locus TH01 của một cá thể, các alen phân biệt nhau bằng số
đoạn lặp AATG
Alen thứ nhất: AATG AATG AATG AATG AATG AATG -> có 6 đoạn
lặp AATG
Alen thứ hai: AATG AATG AATG AATG AATG AATG AATG
AATG AATG -> có 9 đoạn lặp AATG
Locus TH01 này là dị hợp tử với các alen là: 6 - 9
Trang 18những cá thể có quan hệ họ hàng gần gũi Đối với nghiên cứu di truyền quần thể,
cơ sở di truyền của nghiên cứu dựa trên hai định luật căn bản của di truyền học Mendel đó là định luật di truyền phân ly độc lập và định luật di truyền phân ly Do
đó, các chỉ số về di truyền liên kết cân bằng và cân bằng Hardy-Weinberg được
kiểm định đồng thời các phép tính thống kê được sử dụng nhằm tăng tính chính xác, giảm sai số trong phân tích [18], [19]
Trong giám định Pháp y, xác định danh tính có thể được hiểu là sự so sánh
hồ sơ ADN của một người nào đó, lấy từ các mẫu dấu vết sinh học vương lại như
vết máu, đầu lọc thuốc lá, bàn chải đánh răng, lông, tóc, hoặc từ các dấu vết của
một vụ án hiếp dâm như: dịch âm đạo, bao cao su, dịch trên quần lót, băng vệ sinh với một người khác có mối liên quan, hoặc nghi can giả định nhằm xác định danh tính hoặc loại trừ khả năng
Từ nghiên cứu của Gill và CS (1996), Carracedo và Lareu (1998) [4] Tiêu chuẩn của các locus STR sử dụng trong nhận dạng cá thể gồm:
Có tính bền vững cao (tần suất đột biến thấp)
Locus STR phải có tính đa hình, khả năng phân biệt cao (thường lớn hơn ạng dị hợp tử quan sát được lớn hơn 70% Điều này giúp các nhà phân
Trang 19tích chỉ sử dụng một số locus tối thiểu đã đạt được sự phân biệt cá thể một cách tốt
Chiều dài đoạn (locus) ADN được nhân bội trong khoảng 90 – 500bp,
với kích thước đoạn ADN ngắn phù hợp cho việc phân tích những mẫu dấu vết bị suy thoái thường gặp trong lĩnh vực hình sự
Locus: là vị trí cụ thể của một gen nào đó trên nhiễm sắc thể mang ADN
chứa gen đó Nói cách khác locus là vị trí vật lý của gen trên phân tử ADN, giống như một địa chỉ, một nhà trên đường phố [20], [21]
Hình 1.2 Các locus trên m ột nhiễm sắc thể
Năm 1997, Cục điều tra Liên bang của Mỹ (FBI) công bố lựa chọn 13 locus STR để tạo thành cơ sở dữ liệu quốc gia Hoa Kỳ, gồm: D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, FGA, TH01, TPOX, vWA [38]
Vào đầu năm 2015, FBI thông báo dự án nghiên cứu bổ sung thêm 7 locus vào hệ Codis, có hiệu lực từ ngày 1 tháng 1 năm 2017 gồm: D1S1656, D2S441, D2S1338, D10S1248, D12S391, D19S433, D22S1045 Đây đều là các locus trong
hệ Global filer
Trang 20Hình 1.3 V ị trí của 13 Locus trong CoDis trên NST
1.3 Tình hình nghiên c ứu trong và ngoài nước
1.3.1 Tình hình nghiên c ứu trong nước
Giám định ADN trong Pháp y ở Việt Nam bắt đầu phát triển mạnh mẽ từ
những năm 2000 Đầu tiên được triển khai tại Viện Khoa học hình sự Bộ Công An Ban đầu chỉ là các bộ kit 10 locus, 13 locus, và gần đây là 16 locus, 24 locus
Sau đó công tác giám định ADN được nhiều cơ quan, viện nghiên cứu, công ty thương mại tham gia như: Viện Pháp y Quân đội - Bộ Quốc phòng, Viện công nghệ sinh học - Viện Hàn Lâm Khoa học Việt Nam, Công ty Gentis, công ty CGAT
Năm 2000, đề tài cấp Bộ nghiên cứu khảo sát và xây dựng tần suất của các gen trong hệ Nineplex (10 locusgen, trong đó có 1 locus gen xác định giới tính) được triển khai vào năm 2002 đã được nghiệm thu đưa vào sử dụng làm
cơ sở tính toán kết quả giám định ADN [11] tại Viện Khoa Học Hình Sự
Năm 2006, Viện Pháp y Quân Đội được trang bị và triển khai sử dụng kit phân tích ADN hệ powerplex 16 (gồm 15 locus gen và 1 locus gen xác định giới tính) để tăng hiệu quả phân tích gen (ADN) phục vụ cho công tác điều tra, phá án, tìm kiếm nạn nhân trong các vụ việc cũng như trong các vụ giám định ngoài tố ụng
Trang 21Đến năm 2011, một đề tài cấp bộ do Viện Khoa học hình sự chủ trì đã hoàn thành việc khảo sát tần suất alen các locus gen hệ Identifiler trong quần thể người
Việt (Kinh) với 170 cá thể
Từ 2014 đến 2018 có nhiều đề tài về khảo sát tần suất như: Xây dựng cơ sở
dữ liệu về tần số allele 22 locus đa hình STR trên nhiễm sắc thể thường ở quần thể người Mông tại Hà Giang, Việt Nam của tác giả Trần Huyền Linh (2018); đề tài:
Khảo sát tần suất các alen trong các locus gen(ADN) hệ Identifiler của dân tộc H’Mông phục vụ cho công tác giám định gen ở Việt Nam của tác giả Nguyễn Như Giang (2014)
Đến năm 2016 Viện Pháp y Quân đội đưa vào sử dụng bộ Kit Globalfiler 24 locus gen Ở Việt Nam, cho đến nay chưa có một nghiên cứu hoàn chỉnh nào được công bố về khảo sát sự phân bố tần suất các alen của các locus gen hệ Globalfiler trong quần thể người Kinh được công bố
1.3.2 Tình hình nghiên c ứu trên thế giới
Trên thế giới, công nghệ giám định ADN phát triển mạnh mẽ, nhất là tại Mỹ, nơi có khoa học công nghệ phát triển nhất toàn cầu [26] Các nhà khoa học, các phòng giám định gen, các trung tâm nghiên cứu đều đã nghiên cứu, khảo sát và công bố kết quả của mình về sự phân bố tần suất các alen của các gen hình sự Ví
dụ như tập đoàn Applied Biosystem (Mỹ) khảo sát 15 gen của người Mỹ - Phi, người Mỹ - Tây Ban Nha Kết quả khảo sát 15 gen của người Hán - Trung Quốc, Malaisya, Hàn quốc, Thái Lan đã được công bố Đây là những số liệu rất có giá
trị không chỉ đối với lĩnh vực giám định gen của các nước đó mà còn có giá trị về
mặt khoa học đối với các giám định viên và các nhà khoa học nghiên cứu về gen
sử dụng trong giám định ADN trên thế giới [22], [23], [24]
Trong giám định ADN, bên cạnh việc sử dụng rộng rãi bộ kít của hãng Applied Biosystem, bộ kít của hãng Promega cũng được nhiều nơi sử dụng [25]
Ví dụ tại Mỹ, mỗi bang có từ 1 đến nhiều phòng thí nghiệm giám định ADN và có
thể dùng kit hệ Identifiler hoặc kit PowerPlex Để thống nhất trên toàn nước Mỹ,
cảnh sát liên bang Mỹ (FBI) hiện dùng cơ sở dữ liệu tần suất của 13 locus gen (trùng nhau trong hệ Identifiler và hệ PowerPlex) trong phần mềm CODIS (Combined DNA index system) - một phần mềm nổi tiếng để truy xuất, tìm kiếm,
Trang 22so sánh dữ liệu trong giám định ADN [27] Phần mềm này đang được triển khai ở
49 quốc gia và vùng lãnh thổ trên thế giới
Trong những năm gần đây, có nhiều công trình nghiên cứu công bố tần suất alen trong hệ Globalfiler trên thế giới như:
Dữ liệu di truyền quần thể của 21 markers STR ở các tỉnh biên giới phía Nam của Thái Lan, năm 2017 của nhóm tác giả N Boonderm, D Suriyanratakonrn, S Sangpueng
Dữ liệu di truyền quần thể của 21 locus STR trên nhiễm sắc thể thường hệ Globalfiler của quần thể người Bahrain, năm 2019
Dữ liệu dân số và cấu trúc phát sinh loài của quần thể người Hán, tỉnh Giang Tô, Trung Quốc trên hệ GlobalFiler, năm 2018
Dữ liệu di truyền quần thể của 21 locus STR ở quần thể người Akan của Ghana, tháng 8 năm 2020 [28], [29], [30]
Đây là những số liệu rất có giá trị trong công tác giám định ADN trong nước và trên thế giới
N ội dung nghiên cứu của đề tài gồm các bước:
- Thu 200 mẫu tế bào của 200 cá thể người Kinh Các mẫu được lấy từ
những người ngẫu nhiên trong quần thể không có quan hệ họ hàng huyết thống (trong vòng 3 đời)
- Phân tích mẫu bao gồm các bước:
Tách chiết ADN
Định lượng ADN
Nhân bội ADN
Điện di trên máy điện di mao quản
Phân tích kiểu gen của 200 mẫu nghiên cứu
- Xử lý số liệu thống kê, tính toán tần suất alen và các chỉ số pháp y So sánh kết quả thu được với các nghiên cứu khác trong khu vực và trên thế giới
Trang 23CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Vật liệu nghiên cứu
2.1.1 Đối tượng nghiên cứu
- Thu 200 mẫu tế bào từ nhiều nguồn khác nhau như: máu, tóc, mô, niêm
mạc miệng, móng tay của 200 cá thể người Kinh Trong đó có 96 mẫu niêm mạc
miệng, 55 mẫu tóc có chân, 36 mẫu máu lấy bằng thẻ FTA, 13 mẫu móng tay
- Mẫu được thu và lưu trữ tại Khoa Xét nghiệm - Viện Pháp y Quân đội
2.1.2 Hóa ch ất, thiết bị sử dụng trong nghiên cứu
2.1.2.1 Hóa chất, thiết bị sử dụng trong tách chiết ADN
Dung dịch Chelex 100, tỷ lệ 5% (Bio rad - Mỹ)
Dung dịch PBS (Phosphate - Buffered Saline) (Bio rad - Mỹ)
Thẻ FTA thu mẫu (Mỹ)
SDS (Sodium dodecyl sulfate) (Bio rad - Mỹ)
DDT (Dithiothreitol 1M -Mỹ) (Bio rad - Mỹ)
Proteinase k (Thermo Scientific - Mỹ)
Nước cất khử ion và khử trùng (free DNA) (Thermo Scientific - Mỹ)
Cồn 70o (Việt Nam)
Block nhiệt khô cho ống 1,5ml (100oC) kèm nhiệt kế (Thermo Scientific
- Mỹ)
Máy li tâm Sigma ống 1,5ml 13.000v/p (Sigma - Đức)
Tủ an toàn sinh học (Bio rad - Mỹ)
Ống tách chiết 1,5ml (Thermo Scientific - Mỹ)
Các đầu típ 10 μl, 200 μl và 1000 μl cùng pipet tương ứng (Thermo Scientific - Mỹ)
Găng tay cao su
2.1.2.2 Hóa ch ất, thiết bị sử dụng trong định lượng ADN
Quantifiler™ Trio DNA Quantification Kit (Thermo Scientific -
Mỹ)
Optical plate 96 well (Thermo Scientific - Mỹ)
Optical seal (Thermo Scientific - Mỹ)
Máy Realtime PCR 7500 (Applied biosystems)
Trang 24 Các loại đầu típ 10 μl, 200 μl và 1000 μl cùng pipet tương ứng (Thermo Scientific - Mỹ)
Tủ an toàn sinh học (Bio rad - Mỹ)
Găng tay cao su
2.1.2.3 Hóa chất, thiết bị sử dụng trong nhân gen và giải trình tự
Máy giải trình tự Applied biosystems 3500(Applied
Biosystems-ThermoFisher, Mỹ)
Máy PCR 9700 96 well (Applied biosystems)
Máy PCR Veriti 96 well (hãng Applied biosystems)
Kit GlobalFiler™ PCR Amplification của hãng Applied
biosystems
POP 4 (ABI)
Liz 600 Gene scan (Applied Biosystems-ThermoFisher, Mỹ)
HIDI formamide (Applied Biosystems-ThermoFisher, Mỹ)
Buffer 10X for AB - 3500 (Applied Biosystems-ThermoFisher, Mỹ)
Capilary 3500(36cm x 50μl) (Applied Biosystems-ThermoFisher, Mỹ)
Optical plate 96 well (Applied Biosystems-ThermoFisher, Mỹ)
Septa (Applied Biosystems-ThermoFisher, Mỹ)
Ống PCR (0,25 ml) và điện di (0,5 ml) (Applied
Biosystems-ThermoFisher, Mỹ)
Các loại đầu típ 10 μl, 200 μl và 1000 μl cùng pipet tương ứng (Applied Biosystems-ThermoFisher, Mỹ)
Buồng thao tác PCR (Bio rad - Mỹ)
Găng tay cao su
2.1.2.4 Phần mềm sử dụng
GenMapper ID_X software
HID real time PCR analysis software
Trang 252.1.3 Đặc điểm của bộ kit GlobalFiler™ PCR Amplification Kit
Hình 2.1 B ộ Kit GlobalFiler™ PCR Amplification Kit
Đây là bộ kit đầu tiên có 6 dye màu, cho phép khuếch đại và phân tích cùng lúc 24 locus Có thể nói đây là bộ Kit tốt nhất hiện nay phù hợp với nhu cầu giám định Pháp y do có thời gian khuếch đại ngắn, khả năng phân biệt vượt trội, giúp cho các phòng thí nghiệm ADN pháp y trên thế giới tối đa hóa việc khôi phục và hoàn thiện thông tin của các mẫu nghèo dấu vết
Đặc điểm của bộ kit Globalfiler 24 locus:
Hệ thống đệm và hóa chất được tối ưu hóa, hàm lượng ADN đầu vào được mở rộng, đem lại độ nhạy tối đa cho các mẫu dấu vết, hiện trường nghèo ADN
Cân bằng màu được tối ưu hóa, giúp dễ dàng phân biệt và phân tích các
mẫu nhiễm, hỗn hợp
Bộ kit có chứa 10 mini STR, giúp cho việc phân tích các mẫu dấu vết nghèo ADN đem lại hiệu quả cao hơn
Đây là bộ kit duy nhất chứa tất cả các maker của hệ codis và các maker
sử dụng trên toàn cầu
Bộ Kít gồm 1 ống Mastermix, 1 ống primer, 1 ống đối chứng dương, 1 ống Liz600, 1 ống thang alen chuẩn Allelic ladder
Trang 26Hình 2.2 Locus c ủa G lobalFiler™ PCR Am plification Kit
Đặc điểm của các locus gen STR trong bộ kit này:
- Locus gen D8S1179 nằm trên nhiễm sắc thể số 8, dài 108 - 176 cặp bazơ, có 15 alen: 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19
- Locus gen D21S11 nằm trên nhiễm sắc thể số 21, dài 180 - 247 cặp bazơ, có 24 alen: 24, 24.2, 25, 26, 27, 28, 28.2, 29, 29.2, 30, 30.2, 31, 31.2, 32, 32.2, 33, 32.2, 33, 33.2, 34, 34.2, 35, 35.2, 36, 37, 38
- Locus gen D7S820 nằm trên nhánh dài nhiễm sắc thể số 7, dài 257 -305
Trang 27- Locus gen D13S317 nằm trên nhánh dài nhiễm sắc thể số 13, dài 197 –
- Locus gen D22S1045: dài 83 - 127 cặp bazơ, có 12 alen: 8, 9, 10, 11, 12,
13, 14, 15, 16, 17, 18, 19
- Locus gen SE33: dài 306 - 444 cặp bazơ, có 34 alen: 4.2, 6.3, 8, 9, 11,
12, 13, 14, 15, 16, 17, 18, 19, 20, 20.2, 21, 21.2, 22.2, 23.2, 24.2, 25.2, 26.2, 27.2, 28.2, 29.2, 30.2, 31.2, 32.2, 33.2, 34.2, 35, 35.2, 36, 37
- Locus gen D10S1248: dài 80 - 132 cặp bazơ, có 12 alen: 8, 9, 10, 11, 12,
13, 14, 15, 16, 17, 18, 19
Trang 28- Locus gen D1S1656: dài 154 - 210 cặp bazơ, có 16 alen: 9, 10, 11, 12,
ADN dương
007
D3S1358 3p21.31 9, 10, 11, 12, 13, 14, 15, 16,
17, 18, 19, 20
FAMTM
Trang 2913.2, 14, 14.2, 15, 16, 17, 18,
19, 20, 21, 22, 23, 24, 25, 26,
27 DYS391 Yq11.21 7, 8, 9, 10, 11, 12, 13 11 D2S441 2p14 8, 9, 10, 11, 11.3, 12, 13,
17, 15.2
Trang 3035, 35.2, 36, 37 D10S1248 10q26.3 8, 9, 10, 11, 12, 13, 14, 15,
của Liên hợp quốc năm 2019)
Trang 312.2 Phương pháp nghiên cứu
Mẫu được nghiên cứu và phân tích theo sơ đồ tổng quát sau:
2.2.1 Phương pháp thu mẫu:
- Thu mẫu tế bào trực tiếp của những người ngẫu nhiên, thuộc dân tộc Kinh, không có quan hệ huyết thống trong vòng 3 đời:
Đối với mẫu máu, mẫu được thu bằng thẻ FTA chuyên dụng kích thước 2×2 mm
Đối với tóc, mẫu thu từ 2 đến 10 sợi tóc có chân và bảo quản trong phong bì riêng biệt, được đánh số ký tự lưu mẫu
Đối với mẫu niêm mạc, mẫu được thu bằng tăm bông y tế chuyên dụng
Đối với mẫu móng tay: dùng kìm cắt phần móng tay sát nhất với ngón tay
Thu m ẫu: Máu, tóc có chân, niêm m ạc miệng, móng tay
Tách chi ết ADN bằng chelex 5%
Định lượng ADN bằng máy Real time PCR
7500
Nhân b ội (PCR) ADN bằng GlobalFiler™
PCR Amp lificat ion
Gi ải trình tự ADN trên máy 3500
Phân tích k ết quả trên phần mềm Genmapper
- IDX
Trang 32Mẫu thu đảm bảo chất lượng, không bị lẫn, nhiễm, phơi khô tự nhiên, đóng gói riêng rẽ Mẫu sau khi dùng, được lưu và bảo quản trong tủ lưu mẫu ở nhiệt độ -20oC
2.2.2 Phương pháp phân tích mẫu
2.2.2.1 Tách chiết ADN bằng Chelex
Hiện nay tại hầu hết các phòng thí nghiệm, giám định ADN đều sử
dụng Chelex cho việc tách chiết mẫu tế bào tươi
Chelex là một loại nhựa tạo phức có ái lực cao đối với các ion kim loại
đa hoá trị Nó là hợp chất trùng ngưng styrene divinylbenzene có chứa các cặp ion imminodiaxetat hoạt động là nhóm tạo phức Sự có mặt của chelex ở nhiệt độ
100oC sẽ ngăn cản sự biến tính của ADN vì nó gắn được với các ion kim loại đa hoá trị như magnesium (Mg2+) Nhờ việc loại bỏ Mg2+ ra khỏi phản ứng thì các enzym phân huỷ ADN (nuclease) sẽ bị bất hoạt và do vậy mà các phân tử ADN được bảo vệ [31]
Tách chiết ADN bằng chelex là phương pháp vô cơ, có ưu điểm thao tác đơn giản, ít bị nhiễm và tốn ít thời gian Có thể tách chiết ADN bằng phương pháp Chelex các loại mẫu sinh học sau đây: chân tóc, niêm mạc miệng, máu toàn
phần, vết máu, móng tay, mô, tủy xương từ các mẫu xương tươi
200 mẫu tế bào của 200 cá thể người Kinh được tách chiết bằng Chelex theo quy trình dưới đây:
a) Tách chiết ADN bằng Chelex từ chân tóc
1 Ghi nhãn các ống nghiệm 1.5 ml
2 Hút 1ml PBS vào ống nghiệm 1.5 ml
3 Sử dụng kéo sạch cho mỗi mẫu, cắt vào ống nghiệm khoảng 2mm tóc
có chân của 2-3 sợi tóc
4 Vortex với tốc độ cao, ủ ở nhiệt độ phòng ít nhất 30 phút
5 Ly tâm ống nghiệm 13.000 vòng trong 1 phút
6 Loại bỏ dịch nổi
7 Thêm vào ống nghiệm 200µl Chelex 5%
8 Ủ ở 560C trong vòng ít nhất 30 phút
Trang 3310 Ly tâm ống nghiệm 13.000 vòng trong 3 phút, thu ADN
11 Bảo quản mẫu ở tủ -20oC
b) Tách chi ết ADN bằng Chelex từ tăm bông(chứa niêm mạc miệng)
1 Ghi nhãn các ống nghiệm 1.5 ml
2 Hút 1ml PBS vào ống nghiệm 1.5 ml
3 Sử dụng kéo sạch cho mỗi mẫu, cắt vào ống nghiệm khoảng 2 ×2mm bông trên que tăm bông
4 Vortex với tốc độ cao, ủ ở nhiệt độ phòng ít nhất 30 phút
5 Ly tâm ống nghiệm 13.000 vòng trong 1 phút
6 Loại bỏ dịch nổi
7 Thêm vào ống nghiệm 200µl Chelex 5%
8 Ủ ở 560C trong vòng ít nhất 30 phút
9 Đun sôi cách thủy mẫu trong 8 phút
10 Ly tâm ống nghiệm 13.000 vòng trong 3 phút, thu ADN
11 Bảo quản mẫu ở tủ -20oC
c) Tách chiết ADN bằng Chelex từ máu toàn phần, huyết thanh và máu khô (trên gạc hoặc giấy FTA)
1 Ghi nhãn các ống nghiệm 1.5 ml
2 Hút 1ml PBS vào ống nghiệm 1.5 ml
3 Thêm vào ống từ 2 - 3 µl máu toàn phần, 5 - 10 µl huyết thanh, 3mm2
gạc hoặc giấy FTA chứa máu khô
4 Vortex với tốc độ cao, ủ ở nhiệt độ phòng ít nhất 30 phút
5 Ly tâm ống nghiệm 13.000 vòng trong 1 phút
6 Loại bỏ dịch nổi (rửa lại bằng nước khử ion 3 lần)
7 Thêm vào ống nghiệm 200µl Chelex 5%, 10 µl protein K
8 Ủ ở 560C trong vòng ít nhất 30 phút
9 Đun sôi cách thủy mẫu trong 8 phút
10 Ly tâm ống nghiệm 13.000 vòng trong 3 phút, thu ADN
11 Bảo quản mẫu ở tủ -20oC
d) Tách chi ết ADN bằng Chelex từ mẫu móng tay, móng chân
1 Ghi nhãn các ống nghiệm 1.5 ml
Trang 342 Hút 1ml cồn tuyệt đối vào ống nghiệm 1.5 ml
3 Thêm vào ống 2mm2 móng tay (móng chân), ủ ở nhiệt độ phòng từ 3-6
giờ
4 Rửa siêu âm ống nghiệm trong vòng 5 phút
5 Ly tâm ống nghiệm 13.000 vòng trong 1 phút
11 Đun sôi cách thủy mẫu trong 8 phút
12 Ly tâm ống nghiệm 13.000 vòng trong 3 phút, thu ADN
13 Bảo quản mẫu ở tủ -20oC
2.2.2.2 Định lượng ADN sau khi tách chiết, sử dụng bộ kit Quantifiler™ Trio DNA Quantification Kit trên máy Realtime PCR
7500
Định lượng ADN trên máy Realtime PCR là công nghệ sử dụng kỹ thuật PCR có gắn mồi huỳnh quang, mục đích để phát hiện chính xác số lượng ADN người có trong mẫu cần phân tích
200 mẫu ADN của 200 cá thể người Kinh sau khi tách chiết, được đưa vào
máy Realtime 7500 để đo nồng độ theo quy trình sau:
Bước 1: Chuẩn bị Standard (ADN chuẩn có nồng độ biết trước)
1 Chuẩn bị 5 ống nghiệm 1,5 ml, đánh số lần lượt Std1, Std2, Std3, Std4,
Std5
2 Vortex 1 phút Quantifiler® THP DNA Dilution buffer và Quantifiler®
THP DNA Standard, sau đó ly tâm nhẹ cho dung dịch không bám ở thành ống
3 Thêm 10 µl Dilution buffer vào ống nghiệm Std1, 90 µl Dilution buffer vào các ống nghiệm Std2, Std3, Std4, Std5
Trang 354 Thêm 10 µl Standard vào ống nghiệm Std1, vortex tốc độ cao, sau đó ly tâm nhẹ
5 Thêm 10 µl Std1 vào ống nghiệm Std2, vortex tốc độ cao, sau đó ly tâm
Bước 2: Chuẩn bị phản ứng Realtime PCR
1 Tính thể tích của mỗi thành phần cần chuẩn bị cho phản ứng, dựa vào
4 Vortex hỗn hợp trong ống nghiệm từ 3 - 5 giây, sau đó ly tâm nhẹ
5 Chuẩn bị plate 96 giếng, chia 18 µl PCR mix vào mỗi giếng trên plate
6 Thêm 2 µl ADN mẫu, standard, mẫu âm, mẫu dương vào từng giếng
7 Dán plate với Optical Adhesive Cover, sau đó ly tâm plate 300 vòng trong 20 giây
Trang 36Mỗi phản ứng Realtime PCR sẽ kèm theo mẫu đối chứng âm và mẫu đối
chứng dương (nhà sản xuất cung cấp), để xác định tính chính xác của phản ứng
Bước 3: Chạy plate đã chuẩn bị trên Real time PCR 7500
1 Khởi động máy tính và máy Realtime PCR 7500
2 Tạo plate trên máy
3 Cho plate vào khay
4 Chọn protocol phù hợp với chu trình nhiệt:
B ảng 2.3 Chu trình nhiệt của phản ứng PCR trên máy Realtime 7500
Nhi ệt độ Th ời gian S ố chu kỳ
6 Sau khi máy chạy xong xem kết quả tính toán nồng độ ADN
2.2.2.3 Nhân bội ADN (PCR - Polemerase Chain Reaction)
Khái quát v ề phản ứng PCR
Nhân bội ADN (PCR) nghĩa là làm tăng lượng ADN lên hàng triệu bản sao
từ một lượng rất ít ban đầu [21] Lượng ADN sau nhân bội đủ lớn để có thể phát
hiện được bằng các phương pháp thông thường
Kỹ thuật PCR do Karry Mullis và các cộng sự phát minh vào năm 1985 đã
tạo ra một cuộc cách mạng trong sinh học phân tử bởi khả năng áp dụng của nó trong phân tích ADN Kỹ thuật này là một phương pháp hoàn toàn mới trong việc nghiên cứu và phân tích các gen Các phòng thí nghiệm phân tích ADN và ngành khoa học hình sự đã có những thành tựu vượt bậc nhờ vào kỹ thuật này [20] ADN thu được từ hiện trường thường ít và chất lượng không tốt do vậy nhiều mẫu sẽ không thể phân tích được
Kỹ thuật PCR sẽ giúp khắc phục hạn chế này vì nó có thể tạo ra hàng triệu phiên bản của một trình tự ADN khuôn ban đầu trong vòng vài giờ nhờ hai đoạn
Trang 37sequence) với sự tham gia của ADN - polymerase,deoxynucleotide triphosphate (dNTPs), đệm PCR [22]… Phản ứng PCR là một chuỗi nhiều chu kỳ nối tiếp nhau,
mỗi chu kỳ gồm 3 bước:
Bước 1: Giai đoạn biến tính: Phân tử ADN được biến tính ở nhiệt độ
thường là ở 94oC - 95oC trong vòng 30 giây đến 1 phút Khi đó các liên kết Hydro trong phân tử bị bẻ gãy và ADN sợi kép bị tách thành hai sợi đơn
Bước 2: Giai đoạn bắt mồi: Nhiệt độ được hạ thấp (thấp hơn Tm của các
mồi) cho phép các mồi bắt cặp với khuôn, nhiệt độ này dao động trong khoảng 40
- 70 oC tuỳ thuộc Tm của các mồi sử dụng kéo dài từ 30 giây đến 1phút
Bước 3: Giai đoạn kéo dài chuỗi (extension): Nhiệt độ được tăng lên có thể
đến 72oC giúp cho ADN - polymerase hoạt động tổng hợp tốt nhất, thời gian tùy thuộc vào độ dài của trình tự ADN cần khuếch đại Thường kéo dài từ 30 giây đến vài phút
Trước chu kỳ đầu tiên thường có một bước khởi động nóng ở 94oC trong vòng 4 – 5 phút để làm biến tính hoàn toàn ADN khuôn Một chu kỳ bao gồm 3 bước trên sẽ được lặp đi lặp lại nhiều lần, mỗi lần sẽ làm tăng gấp đôi lượng mẫu
của lần trước Đây là sự khuếch đại theo cấp số nhân, theo tính toán sau 30 chu kỳ
sự khuếch đại sẽ là 106 so với lượng mẫu ban đầu [22]
Nhân b ội ADN (PCR) 200 mẫu sau khi định lượng
Sau khi định lượng 200 mẫu ADN, chúng tôi tiến hành phản ứng khuếch đại ADN Sử dụng bộ kit GlobalFiler™ PCR Amplification Kit Đây là bộ kit đặc hiệu nhân cùng lúc 21 locus STR và 3 marker giới tính
Ngoài các mẫu nghiên cứu, trong mỗi phản ứng PCR sẽ có thêm mẫu đối
chứng âm, mẫu đối chứng dương (do nhà sản xuất cung cấp) để xác thực tính chuẩn xác của phản ứng
1 Tính thể tích của mỗi thành phần cần chuẩn bị cho phản ứng, dựa vào
bảng sau:
Trang 382 Thêm (7,5 * n) µl Master mix, (2.5 * n) µl Primer set vào ống nghiệm 1,5
ml, trong đó n là số mẫu ADN cần khuyếch đại
3 Vortex hỗn hợp trong ống nghiệm từ 3 - 5 giây, sau đó ly tâm nhẹ
4 Chuẩn bị plate 96 giếng, chia 10 µl PCR mix vào mỗi giếng trên plate
5 Thêm 15 µl ADN mẫu (sau khi đã pha với TE để có nồng độ chuẩn cho
phản ứng), mẫu âm, mẫu dương vào từng giếng
6 Dán plate với Optical Adhesive Cover, sau đó ly tâm plate 300 vòng trong 20 giây
7 Cho plate vào máy PCR 9700, Phản ứng nhân gen (PCR) được tiến hành trên máy nhân gen PCR 9700 của hãng AB
B ảng 2.5 Chu trình nhiệt trên máy PCR 9700
Sản phẩm PCR được bảo quản ở -20oC
Giải trình tự gen bằng máy gải trình tự 3500
Các sản phẩm PCR được đánh dấu bằng hệ màu 6 kênh cho phép tối ưu hóa
hiệu quả phân tích Sản phẩm khuếch đại được điện di và phân tích trên máy giải trình tự gen ABI 3500 Genetic Analyzer với phần mềm GeneMapper ID_X, sử
dụng kích thước chuẩn (GeneScan-600 LIZ, Applied Biosystems, Mỹ) và thang
Trang 39alen chuẩn (ladder) được nhà sản xuất cung cấp theo GlobalFiler™ PCR Amplification Kit (AB, Mỹ)
Nguyên lý c ủa điện di mao quản trên máy giải trình tự
Điện di mao quản (hay điện di huỳnh quang) bắt đầu được sử dụng vào cuối
những năm 1980 Vào giữa những năm 1990 người ta bắt đầu sản xuất các máy điện di mao quản Kể từ đó kỹ thuật điện di mao quản phát triển nhanh chóng và ngày càng phổ biến
Nguyên lý của điện di mao quản là dùng tia lase kích hoạt các đoạn ADN khuôn đã được gắn huỳnh quang để thu được các phổ quang học Điểm khác của điện di mao quản là sử dụng mao quản có chứa gel, tia lase chỉ chiếu vào một điểm
cố định trên mao quản cho từng mẫu một [32], [33]
Các cặp mồi được đánh dấu bằng các chất nhuộm huỳnh quang khác nhau
vì vậy sản phẩm sau PCR có các locus gen được gắn các chất nhuộm huỳnh quang tương ứng Kỹ thuật hiện màu huỳnh quang cho xác định được màu xanh da trời, xanh lá cây, vàng, đỏ, tím, cam tương ứng với các chất đánh dấu: 6 - FAM, VIC, NED,TAZ, SID và LIZ, dựa trên sự hấp thụ và phát xạ ánh sáng của các chất nhuộm màu huỳnh quang này Các hạt huỳnh quang hấp thụ năng lượng từ nguồn sáng laze sau đó phát xạ ánh sáng ở mức năng lượng thấp hơn (bước sóng cao hơn) Một màng lọc sáng được sử dụng để lọc ánh sáng ở những bước sóng xác định hoặc một khoảng bước sóng nào đó [32]
Hiện nay đã có nhiều loại máy điện di mao quản được sử dụng tại các phòng thí nghiệm sinh học phân tử cũng như các phòng giám định gen hình sự như: ABI Prism 310 Genetic Analyzer với một mao quản, ABI Prism 3100Avant Genetic Analyzer với 4 mao quản, ABI Prism 3700 GeneticAnalyzer với 4 mao
quản, ABI Prism 3130 Genetic Analyzer với 4 mao quản, ABI Prism 3130XL Genetic Analyzer với 16 mao quản, ABI Prism 3500 Genetic Analyzervới 16 mao
quản …[32]
Trang 40B ảng 2.6 Các chất nhuộm màu huỳnh quang sử dụng trong bộ Kit Globalfiler
6-FAMTM Xanh da trời Samples, allelic ladders,
Sau khi chuẩn bị mẫu, cho mẫu vào điện di trên máy điện di mao quản AB
3500 Kết quả thu được được xử lý bằng phần mềm Genemapper ID_X để xác định kiểu gen của mỗi mẫu, từ đó cho ta bảng số liệu tập hợp kiểu gen của 200 cá
thể người Kinh
2.2.3 Phân tích x ử lí số liệu và tính toán tần suất alen
2.2.3.4 Phân tích trình t ự ADN của từng mẫu nghiên cứu
Mẫu ADN sau khi giải trình tự (điện di mao quản), được phân tích bằng
phần mềm GeneMapperTM ID-X trên hệ thống AB3500 Genetic Analyzer