1.2 Dấu vân tay DNA Quá trình phát triển hơn 20 năm của kỹ thuật xác định dấu vân tay DNA đã đặt dấu mốc khởi đầu cho sự ra đời của ứng dụng định kiểu DNA trong pháp y mà cụ thể là ứng
Cấu trúc DNA
Acid nucleic trong tế bào tồn tại dưới hai dạng: deoxyribonucleic acid (DNA) và ribonucleic acid (RNA) Khoảng 90% acid nucleic trong tế bào là RNA, phần còn lại là DNA
DNA là chất hóa học góp phần chính tạo nên nhiễm sắc thể Một đoạn DNA mang một chức năng nhất định trong quá trình truyền thông tin di truyền được gọi là gen Về mặt cấu trúc, DNA là một chuỗi xoắn kép bao gồm hai sợi đơn xoắn quanh nhau Mỗi sợi chứa một trình tự các base (còn gọi là nucleotide) Có bốn loại base là Adenin (A), Guanin (G), Cytosin (C) và Thymin (T) Các base trên hai sợi đơn DNA liên kết nhau theo nguyên tắc bổ sung: A chỉ liên kết với T, G chỉ liên kết với C.
Dấu vân tay DNA
Tiểu vệ tinh (Minisatellites)
Tiểu vệ tinh hay còn gọi là Variable Number Tandem Repeats (VNTRs) là những trình tự lặp lại với số lần biến thiên Những VNTRs locus này chứa các đơn vị lặp lại có chiều dài thay đổi từ 6bp đến hơn 100 bp và những nhóm này thường tạo thành những đoạn dài hàng kilobase Những tiểu vệ tinh giàu GC thường phân bố thành nhóm nằm trong vùng tái tổ hợp gần đầu của nhiễm sắc thể [30]
Năm 1984, việc khám phá tình cờ vùng locus tiểu vệ tinh siêu biến bằng kỹ thuật Multi-Locus Probes (MLPs)- đoạn dò tại nhiều vị trí -của Alec Jeffreys đã mở ra thêm công cụ hỗ trợ cho điều tra pháp y [20] Tuy nhiên, thử
Trang 4 nghiệm MLPs đòi hỏi hàng microgram hàm lượng DNA bộ gen có chất lượng cao, do đó thường phải thu thập lượng mẫu lớn chẳng hạn cần lấy không dưới 10ml máu, Trong pháp y, lượng mẫu DNA thường rất ít, nhỏ, chất lượng kém do bị thoái hóa theo thời gian hay tác động môi trường, vì thế nhìn chung kỹ thuật MLPs không là công cụ hữu hiệu cho hầu hết các trường hợp [13] Để khắc phục các hạn chế của MLPs, người ta dùng những tiểu vệ tinh đã được dòng hóa chuyên biệt làm Single-Locus Probes(SLPs) – đoạn dò tại một vị trí nhất định – nhằm tạo “hồ sơ DNA” đơn giản hơn và ứng dụng vào các cuộc điều tra đối tượng tội phạm mà trước đó MLPs đã được thương mại hóa và công nhận như phương pháp chính thức dùng trong phân tích quan hệ phụ tử Bởi vì mỗi SLP chỉ phát hiện một tiểu vệ tinh nên nó tạo ra hai vạch (hai alen) nhưng vẫn đạt độ đa hình cao nhờ việc sử dụng nhiều tiểu vệ tinh siêu biến SLPs thuận lợi đáng kể hơn so với MLPs trong phân tích các mẫu pháp y Phương pháp này có độ nhạy cao hơn rất nhiều, giới hạn phát hiện các băng ở khoảng 10ng DNA bộ gen Các mẫu DNA hỗn hợp chẳng hạn như que phết tế bào âm đạo có lẫn tinh dịch cũng có thể phân tích tương đối dễ hơn bởi DNA gốc từ nạn nhân chỉ có hai băng và kết quả của kỹ thuật xạ ký tự động sẽ cho thấy “hồ sơ DNA”có nhiều hơn hai băng hay không Tuy nhiên, do sự phân bố kích thước các alen liên tiếp nhau và giới hạn độ phân giải của quá trình điện di thạch agarose, việc xác định kích thước alen SLP khó có thể cho kết quả chính xác tuyệt đối [17] Đồng thời, việc tính tần suất alen và xác suất tương hợp cũng bị loại bỏ vào năm 1996 [29]
Một vài vị trí tiểu vệ tinh chứa các alen kích thước tương đối ngắn (0,9 và dị hợp tử >0.7 - Tách biệt vị trí trên nhiễm sắc thể tránh trường hợp liên kết vùng gen
- Cho kết quả rõ ràng khi chạy phản ứng multiplex - Đặc tính tạo stutter thấp
- Tỷ lệ đột biến thấp
- Chiều dài của các alen ước đoán nằm trong khoảng 90-500bp với kích thước nhỏ hơn, phù hợp cho việc phân tích các mẫu DNA thoái hoá Để thuận tiện, các locus STR điển hình ứng dụng trong hồ sơ DNA thường được thiết kế trên các nhiễm sắc thể riêng biệt nhằm tránh những rắc rối do sự liên kết giữa các locus.
Thang alen được dùng trong một số kit STR thương mại
Mỗi nhà sản xuất kit STR đều cung cấp các thang alen nhằm xác định chính xác kiểu hình của gen Điều quan trọng đáng lưu ý là những kit của Promega Corporation và Applied Biosystems đối với các locus STR có thể so sánh được thường chứa các alen trong thang alen của chúng Chẳng hạn trong thang alen tại locus D5S818, kit Powerplex ® 1.1 của Promega chứa các alen 7-
Trang 15 15 trong khi kit Profiler Plus™ của Applied Biosystems chứa các alen 7-16
Dựa vào sự hiện diện của các alen trong thang, phòng thí nghiệm có thể tự tin hơn trong việc gọi ra tên alen trên mẫu chưa biết đã được phân tích Đối với việc xác định alen 16 tại locus D5S818 thì việc dùng kit Applied Biosystems sẽ tự tin hơn khi dùng kit Promega
Gần đây, trên thị trường xuất hiện nhiều kit STR với số lượng alen nhiều đáng kể trong thang Ví dụ như hãng Applied Biosystems đưa ra kit Identifiler™ chứa 205 alen, hãng Promega đưa ra kit Promega PowerPlex ® 16 chứa 209 alen trong thang alen.
Những Kit STR đã thương mại hóa
Hiện nay trên thị trường có rất nhiều kit thương mại sử dụng multiplex PCR nhân bản đồng thời nhiều locus STR cùng 1 lúc như bộ kit
AmpFLSTR® Identifiler® PCR Amplification Kit- ABI, AmpFiSTR Identifiler Plus PCR Amplification Kit-ABI, PowerPlex®16HS System-
Năm 2001, Applied Biosystems đã giới thiệu hai kỹ thuật mới trong kit AmpFℓSTR® Identifiler™ Kỹ thuật thứ nhất liên quan đến việc sử dụng hệ thống phát hiện 5 màu huỳnh quangtrong đó 4 màu khác biệt (6FAM™, VIC™, NED™ và PET™) được sử dụng để đánh dấu các sản phẩm khuếch đại chính xác hơn 3 màu (5FAM, JOE, NED hoặc FL, JOE, TMR) trong các kit AmpFℓSTR hoặc PowerPlex đã dùng trước đây.Kênh phát hiện 1 màu luôn được dùng làm kích thước nội chuẩn trong điện di nhằm xác định rõ kích thước sản phẩm PCR Do vậy, màu thứ 5 (LIZ™) trong hệ thống phát hiện 5 màu và màu thứ 4 (ROX hoặc CXR) trong hệ thống phát hiện 4 màu được sử dụng nhằm đánh dấu kích thước nội chuẩn
Kỹ thuật thứ hai được giới thiệu trong bộ kit Identifiler™ liên quan đến việc bổ sung vùng hiệu chỉnh có bản chất non-nucleotide Các liên kết non- nucleotide được hình thành giữa màu huỳnh quang và đầu 5‟ của trình tự mồi
Trong quá trình khuếch đại, màu huỳnh quang và liên kết sẽ hợp nhất tạo thành amplicon Trong quá trình điện di, việc thêm các liên kết non-nucleotide
Trang 16 vào sẽ làm cho các alen STR được nâng lên thành kích thước lớn và rõ hơn,khoảng trống giữa các STR locus đã được đánh dấu cùng màu huỳnh quang được tối ưu hoá, không thay đổi vị trí gắn kết mồi PCR (Hình 1.3)
Hình 1.3 Mồi đƣợc gắn thêm đuôi hiệu chỉnh [6].
Trang web dữ liệu STRbase
Ứng dụng xác định cá thể dựa vào STR hiện nay phát triển rất nhanh nên việc cập nhật liên tục các alen mới và locus mới là điều hiển nhiên Nhu cầu này được thỏa mãn bởi tốc độ phổ cập rất lớn của mạng toàn cầu Ngày càng nhiều các chuyên trang về lĩnh vực pháp y được thành lập mà một bộ phận không nhỏ chuyên trách về kiểu hình STR Vì thế rất cần chuyên trang mở chính thức cung cấp cơ sở dữ liệu về hồ sơ DNA STRBase được thành lập chính thức vào tháng 7 năm 1997 và được duy trì bởi DNA Technologies Group của the National Institute of Standards and Technology [6,32] Chúng ta có thể truy cập vào trang mạng STRBase [36] và trang mạng này được cập nhật liên tục nên có chứa hơn 2000 tham khảo có liên quan đến hồ sơ DNA và các kiểu STR Dĩ nhiên có cả thông tin liên quan đến các alen mới ngoài thang chuẩn Thông tin chủ yếu khác cũng được cung cấp chẳng hạn các trình tự mồi thường được sử dụng trong các bộ kit, dữ liệu tần suất các quần thể người trên thế giới, …
Các kỹ thuật sử dụng trong việc tạo hồ sơ DNA
Kỹ thuật multiplex PCR
Đây là kỹ thuật PCR sử dụng nhiều cặp mồi nhân bản các STR tại nhiều vị trí khác nhau trong cùng 1 phản ứng, đòi hỏi phải có quá trình tối ưu hóa, tiêu tốn nhiều thời gian, công sức và tiền bạc nhưng nó mang lại ưu thế và sự tiện lợi rất lớn cho ứng dụng thực tiễn lâm sàng cũng như pháp y Trong lĩnh vực pháp y, kỹ thuật đa mồi được Applied Biosystems và Promega ứng dụng thành bộ kit hoàn chỉnh Với chỉ 1 lần chạy phản ứng khuếch đại, các phòng thí nghiệm có thể thu được hồ sơ DNA cá thể với 16 vùng STR trên các nhiễm sắc thể khác nhau với độ chính xác rất cao
Sự ra đời các kit khuếch đại STR multiplex đã thực sự có ý nghĩa rất lớn trong cuộc cách mạng khoa học pháp y về DNA Kit STR multiplex thế hệ thứ nhất được FSS đưa ra với 4 locus TH01, FES/FPS, VWA và F13A1, khả năng đối chiếu khoảng 1:10 4 Tiếp đó FSS lại cho ra kit STR multiplex thế hệ thứ hai gồm locus xác định giới tính và 6 STRs đa hình TH01, VWA, FGA, D8S1179, D18S51, D21S11 với khả năng đối chiếu khoảng 2 x10 -7 Hiện nay thị trường càng có nhiều kit cho phép khuếch đại đồng thời đến 16 locus STR trong một phản ứng với lượng DNA chỉ cần 1ng (hoặc ít hơn), khả năng phân biệt lên đến 1 x 10 -17 và kết quả thu được chỉ trong vài giờ
Kỹ thuật điện di mao quản tự động
Kỹ thuật điện di mao quản được thực hiện đầu tiên vào cuối những năm 1980, sau đó kỹ thuật này được cải tiến vào giữa những năm 1990 và nhanh chóng trở thành công cụ chính trong các phân tích DNA
Nguyên tắc : sản phẩm PCR có gắn màu huỳnh quang kết hợp với thang chuẩn được đặt đồng thới vaọ plate chứa mẫu Máy điện di mao quan tự động nạp DNA vào ống mao quản DNA di chuyến trong ống mao quản và được phân tách bới kích thước khi đi qua cửa sô phát hiên, tia laser kích hoạt các màu huỳnh quang trên DNA và alen của locus sẽ được mã hóa màu Máy đo nồng độ và màu sắc của ánh sáng cũng như thới gian chính xac khi phân tử đi qua ông mao quản [21]
Hệ thống điện di mao quản tự động bao gồm một ống mao quản, hai lọ chứa dung dịch đệm, hai điện cực nối với nguồn điện thế cao (5-20kV), nguồn kích thích bằng tia laser, đầu dò huỳnh quang, khay mẫu tự động và máy tính
Mao quản được làm từ silica nóng chảy (thuỷ tinh), đường kính bên trong khoảng 50-100μm, chiều dài 25-75 cm.Khi ứng dụng vào giám định hồ sơ DNA hiện nay người ta thường sử dụng hệ thống điện di đa mao quản để có thể thu được kết quả sớm nhất
Hình 1.4 Sơ đồ khối một máy điện di mao quản [39]
Kỹ thuật phân tích hồ sơ DNA
1.5.4.1 Kỹ thuật phân tích đoạn
Trang 20 Phần mềm phân tích đoạn xác định kích thước các alen STR và biểu diễn bằng đồ thị với cột đứng cho biết tổng số lượng DNA (chiều cao của peak) và cột ngang cho biết trọng lượng phân tử và chiều dài thật sự của các alen STR(hình 1.5)
Mỗi một alen ID có một kích thước riêng Ví dụ, bảng thành phần alen và kích thước của locus TH01 (xem bảng 1.2)[36]
Bảng 1.2 Thành phần và kích thước các alen của locus TH01
TH01: Alen ID Kích thước chuẩn
TH01: Alen ID Kích thước chuẩn
Hình 1.5 Hai alen 6 và 9.3 của locus TH1[3]
Trong quá trình khuếch đại các alen STR, một số hiện tượng thường gặp gây khó khăn cho việc phân tích và diễn giải kiểu hình của các alen hiện diện trong mẫu DNA đích như sản phẩm stutter (xuất hiện các đỉnh phụ bên cạnh đỉnh alen chính) và non-template addition Ngoài ra còn có một số yếu tố khác cũng ảnh hưởng đến kết quả hồ sơ DNA bao gồm : vi biến (microvariants), kiểu 3 alen (tri-allelic patterns), mất alen (alen dropout) và đột (biến mutation)
Các sản phẩm phụ (Stutter products)
Hình 1.6 Hình ảnh sttuter của một vài alen[7]
Cơ chế giải thích sự xuất hiện các stutter products là do sự bắt cặp lỗi trượt-sợi (slipped-strand mispairing)[16,34] Trong kiểu slipped- strand mispairing, một vùng nào đó của phức hợp primer-template trở nên không bắt cặp được, dẫn đến hiện tượng mồi hoặc sợi khuôn của đoạn trình tự lặp tự tạo thành vòng tròn tự lặp lại (non-base-paired)[16]
Từ đó, vòng lặp lại là sản phẩm PCR có kích thước ngắn hơn alen STR khuếch đại ban đầu một đơn vị lặp lại đơn
Hình 1.7.Cơ chế liên quan việc hình thành stutter [7]
(a) sự bắt cặp diễn ra bình thường, (b) vòng tròn trình tự lặp lại xảy ra trên mạch mới, (c) vòng tròn trình tự lặp lại xảy ra trên mạch khuôn
Trang 22 Các stutter ảnh hưởng phần nào đến việc giải thích kết quả hồ sơ DNA, đặc biệt trong trường hợp hai hoặc nhiều cá thể có thể đã góp phần vào mẫu DNA cần phân tích Bởi vì khi các sản phẩm stutter có kích thước tương tự như các sản phẩm PCR thực thì khó xác định được đâu là stutter của alen kế cận và đâu là đỉnh alen thực? Có thể tóm tắt một số nét nhận dạng stutter như sau :
- Một đỉnh nhỏ và xuất hiện ngay trước đỉnh alen chính tương ứng ; - Tỷ lệ phần trăm chiều cao giữa đỉnh stutter và đỉnh alen tương ứng với nó thường thấp hơn 15% ;
- Lượng stutter tùy thuộc vào loại locus cũng như điều kiện PCR và polymerase đã sử dụng ;
- Xu hướng các stutter sẽ giảm xuất hiện với các đơn vị lặp lại dài hơn (pentanucleotides