Quá trình phát triển hơn 20 năm của kỹ thuật xác định dấu vân tay DNA đã đặt dấu mốc khởi đầu cho sự ra đời của ứng dụng định kiểu DNA trong pháp y, mà cụ thể là ứng dụng hiện tượng các
TỔNG QUAN
Cấu trúc DNA
Acid nucleic trong tế bào tồn tại dưới hai dạng: deoxyribonucleic acid (DNA) và ribonucleic acid (RNA) Khoảng 90% acid nucleic trong tế bào là RNA, phần còn lại là DNA
Theo Watson-Crick DNA có các đặc điểm sau:
(1) DNA gồm hai chuỗi đối song song cùng uốn quanh một trục trung tâm theo chiều xoắn phải, với đường kính 20A o (1Angstrom = 10 -10 m), gồm nhiều vòng xoắn lặp lại một cách đều đặn và chiều cao mỗi vòng xoắn là 34 A o , ứng với 10 cặp base (còn gọi là nucleotide)
(2) Các bộ khung đường-phosphate phân bố ở mặt ngoài chuỗi xoắn và các base nằm ở bên trong; chúng xếp trên những mặt phẳng song song với nhau và thẳng góc với trục phân tử, với khoảng cách trung bình 3,4 A o
(3) Hai sợi đơn gắn bó với nhau bằng các mối liên kết hydro (vốn là lực hóa học yếu) được hình thành giữa các cặp base đối diện theo nguyên tắc bổ sung "một purine - một pyrimidine" Cụ thể là, trong DNA chỉ tồn tại hai kiểu kết cặp base đặc thù là A-T (với hai liên kết hydro) và G-C (với ba liên kết hydro)
(4) Tính chất bổ sung theo cặp base dẫn đến sự bổ sung về trình tự các base giữa hai sợi đơn của mỗi chuỗi xoắn kép
Hình 1.5 Các mô hình cấu trúc chuỗi xoắn kép [39]
Có bốn loại base là Adenin (A), Guanin (G), Cytosin (C) và Thymin (T)
Trang 4DNA là chất hóa học góp phần chính tạo nên nhiễm sắc thể Một đoạn DNA mang một chức năng nhất định trong quá trình truyền thông tin di truyền được gọi là gen [38].
Dấu vân tay DNA
Là phương pháp phân tích các trình tự base lặp lại nhằm phát hiện sự khác biệt giữa cá nhân này với cá nhân khác, hoặc tìm xem họ có quan hệ huyết thống với nhau hay không
ADN của tất cả các sinh vật đều có thành phần giống nhau Điểm khác biệt duy nhất giữa các cá thể trong cùng một loài là trình tự sắp xếp các cặp bazơ nitơ Vì mỗi cá thể sở hữu hàng tỷ cặp bazơ, nên trình tự sắp xếp các cặp bazơ này khác nhau ở mỗi người.
Mọi cá thể có thể được nhận dạng duy nhất dựa trên trình tự các cặp base của họ Tuy nhiên, do có hàng tỷ cặp base nên công việc sẽ vô cùng khó khăn Thay vào đó các nhà khoa học có thể sử dụng một phương pháp ngắn hơn, đơn giản hơn nhiều, dựa vào các mô hình lặp lại trong DNA
Quá trình phát triển hơn 20 năm của kỹ thuật xác định dấu vân tay DNA đã đặt dấu mốc khởi đầu cho sự ra đời của ứng dụng định kiểu DNA trong pháp y, mà cụ thể là ứng dụng hiện tượng các đoạn trình tự DNA lặp lại tuần tự nối tiếp nhau Chúng chiếm khoảng 3% bộ gen người được phân thành 2 nhóm chính: tiểu vệ tinh (minisatellites) và vi vệ tinh (microsatellites) [7]
Tiểu vệ tinh hay còn gọi là VNTRs là những trình tự lặp lại với số lần biến thiên Những VNTR locus này chứa các đơn vị lặp lại có chiều dài thay đổi từ 6bp đến hơn 100 bp và những nhóm này thường tạo thành những đoạn dài hàng kilobase Những tiểu vệ tinh giàu GC thường phân bố thành nhóm nằm trong vùng tái tổ hợp gần đầu của nhiễm sắc thể [26]
Một vài tiểu vệ tinh chứa đoạn trình tự “GGGCAGGANG” (với N có thể là bất kỳ base nào) hoặc nói cách khác là sự liên kết chéo giữa purines và pyrimidines của 2 mạch đơn DNA với nhau Người ta đã đưa ra đề xuất rằng trình tự này có thể hỗ trợ các nhiễm sắc thể trong việc trao đổi DNA Trong các mô hình thay thế, đó là sự hiện diện mặt cis của sợi đôi lân cận tạo ra từ quá trình phân bào giảm nhiễm phá vỡ điểm tới hạn, đó là nguyên nhân chính của biến thể số lượng bản sao lặp lại trong các tiểu vệ tinh Những thay đổi trong tế bào soma được cho là kết quả của những khó khăn trong quá trình sao chép (có thể
Chương 1 Tổng quan tài liệu
Trang 5 bao gồm trượt trong quá trình sao chép và một số hiện tượng khác) Khi các sự kiện như vậy xảy ra sẽ kéo theo những lỗi lặp, tạo ra các tiểu vệ tinh tại hơn 1.000 vị trí trong bộ gen người, từ đó dẫn đến những sự lặp lại khác nhau, tạo nên nét đặc trưng riêng cho từng cá thể [47]
Năm 1984, Alec Jeffreys khám phá ra vùng locus tiểu vệ tinh siêu biến, một bước đột phá mang tính cách mạng trong điều tra pháp y Kỹ thuật này cho phép xác định danh tính cá nhân thông qua đặc điểm di truyền, góp phần nâng cao hiệu quả trong việc giải quyết các vụ án phức tạp.
Tuy nhiên, thử nghiệm mẫu dò đa locus (MLPs) đòi hỏi hàng microgram hàm lượng DNA bộ gen có chất lượng cao, do đó thường phải thu thập lượng mẫu lớn chẳng hạn cần lấy không dưới 10ml máu, Trong pháp y, lượng mẫu DNA thường rất ít, nhỏ, chất lượng kém do bị thoái hóa theo thời gian hay tác động môi trường, vì thế nhìn chung kỹ thuật MLPs không là công cụ hữu hiệu cho hầu hết các trường hợp [13] Để khắc phục các hạn chế của MLPs, người ta dùng những tiểu vệ tinh đã được dòng hóa chuyên biệt làm đoạn dò tại một vị trí nhất định (SLPs) nhằm tạo “hồ sơ DNA” đơn giản hơn và ứng dụng vào các cuộc điều tra đối tượng tội phạm mà trước đó MLPs đã được thương mại hóa và công nhận như phương pháp chính thức dùng trong phân tích quan hệ phụ tử Bởi vì mỗi SLP chỉ phát hiện một tiểu vệ tinh nên nó tạo ra hai vạch (hai alen) nhưng vẫn đạt độ đa hình cao nhờ việc sử dụng nhiều tiểu vệ tinh siêu biến SLPs thuận lợi đáng kể hơn so với MLPs trong phân tích các mẫu pháp y Phương pháp này có độ nhạy cao hơn rất nhiều, giới hạn phát hiện các băng ở khoảng 10ng DNA bộ gen Các mẫu DNA hỗn hợp chẳng hạn như que phết tế bào âm đạo có lẫn tinh dịch cũng có thể phân tích tương đối dễ hơn bởi DNA gốc từ nạn nhân chỉ có hai băng và kết quả của kỹ thuật xạ ký tự động sẽ cho thấy “hồ sơ DNA”có nhiều hơn hai băng hay không Tuy nhiên, do sự phân bố kích thước các alen liên tiếp nhau và giới hạn độ phân giải của quá trình điện di gel agarose, việc xác định kích thước alen SLP khó có thể cho kết quả chính xác tuyệt đối [17] Đồng thời, việc tính tần suất alen và xác suất tương hợp cũng bị loại bỏ vào năm 1996 [28]
Một vài vị trí tiểu vệ tinh chứa các alen kích thước tương đối ngắn (0,9 và dị hợp tử >0.7 + Tách biệt vị trí trên nhiễm sắc thể tránh trường hợp liên kết vùng gen
+ Cho kết quả rõ ràng khi chạy phản ứng multiplex + Đặc tính tạo stutter thấp
+ Tỷ lệ đột biến thấp + Chiều dài của các alen ước đoán nằm trong khoảng 90-500bp với kích thước nhỏ hơn, phù hợp cho việc phân tích các mẫu DNA thoái hoá
Chương 1 Tổng quan tài liệu
Trang 15 Để thuận tiện, các marker STR điển hình ứng dụng trong hồ sơ DNA thường được thiết kế trên các nhiễm sắc thể riêng biệt nhằm tránh những rắc rối do sự liên kết giữa các marker
1.4.2 Những kit STR đã thương mại hóa
Năm 2001, Applied Biosystems đã giới thiệu hai kỹ thuật mới trong kit AmpFℓSTR®
Identifiler™ Kỹ thuật thứ nhất liên quan đến việc sử dụng hệ thống phát hiện 5 màu huỳnh quang trong đó 4 màu khác biệt (6FAM™, VIC™, NED™ và PET™) được sử dụng để đánh dấu các sản phẩm khuếch đại chính xác hơn 3 màu (5FAM, JOE, NED hoặc FL, JOE, TMR) trong các kit AmpFℓSTR hoặc PowerPlex đã dùng trước đây Kênh phát hiện 1 màu luôn được dùng làm kích thước nội chuẩn trong điện di nhằm xác định rõ kích thước sản phẩm PCR Do vậy, màu thứ 5 (LIZ™) trong hệ thống phát hiện 5 màu và màu thứ 4 (ROX hoặc CXR) trong hệ thống phát hiện 4 màu được sử dụng nhằm đánh dấu kích thước nội chuẩn
Hình 1.7 Mồi được gắn thêm đuôi hiệu chỉnh [4]
Kỹ thuật thứ hai được giới thiệu trong bộ kit Identifiler™ liên quan đến việc bổ sung vùng hiệu chỉnh có bản chất non-nucleotide, được cấu tạo từ các hexaethyleneoxide (HEO), mỗi đơn vị HEO dài khoảng 2.5 nucleotide Các liên kết non-nucleotide được hình thành giữa màu huỳnh quang và đầu 5’ của trình tự mồi Trong quá trình khuếch đại, màu huỳnh quang và liên kết sẽ hợp nhất tạo thành amplicon Trong quá trình điện di, việc thêm các liên kết non-nucleotide vào sẽ làm cho các alen STR được nâng lên thành
Trang 16 kích thước lớn và rõ hơn, khoảng trống giữa các STR locus đã được đánh dấu cùng màu huỳnh quang được tối ưu hoá, không thay đổi vị trí gắn kết mồi PCR (Hình 1.7) [4].
Các kỹ thuật sử dụng trong việc tạo hồ sơ DNA
Để các marker trong hồ sơ DNA có giá trị pháp lý cao, các nhà nghiên cứu luôn phải sử dụng bộ marker chuẩn Hiện nay, các STR locus thông dụng thường mang nét đặc trưng và phát triển khởi đầu hoặc từ phòng thí nghiệm của tiến sĩ Thomas Caskey tại trường Y khoa Baylor [11]; [15] hoặc từ Sở Khoa học Pháp Y (FSS-Forensic Science Service) tại Anh [23]; [32] Promega (Madison, Wisconsin) thương mại hóa nhiều marker của Caskey trong khi Applied Biosystems (Foster City, California) lại chọn các STR locus của Sở Khoa học Pháp Y (FSS) để phát triển một số marker mới
Tên STR marker được đặt tùy vào vị trí marker nằm trong hay ngoài một gen Nếu marker rơi vào vùng gen chức năng hoặc một phần của gen, tên gen được dùng cho marker ví dụ:
TH01 trong đó TH là viết tắt từ tên gen tyrosine hydroxylase nằm trên nhiễm sắc thể
11 và số 01 là vùng intron đầu tiên của gen này có chứa đoạn lặp lại kiểu[AATG] và [TCAT] thuộc vạch 15.5 trên cánh ngắn của nhiễm sắc thể thứ 11 (11p15.5) [5] vWA là đoạn DNA chứa kiểu lặp lại của [AGAT], [TCTA], [TCTG] và [TCCA] nằm trong intron thứ 40 của nhân tố von WillebrDNA thuộc vạch 13.31 trên cánh ngắn của nhiễm sắc thể thứ 12 (12p13.31) [5]
TPOX là marker chứa kiểu lặp lại của [AATG] nằm trong vùng intron thứ 10 của thyroid peroxidase gen thuộc vạch phụ thứ 3 trong vạch 25 trên cánh ngắn của nhiễm sắc thể thứ 2 (2p25.3) [5]
CSF1PO là vùng DNA chứa kiểu [AGAT] thuộc intron thứ 6 của gen c-fms proto- oncogen for CSF-1 receptor nằm trong vạch 33.1 của cánh dài nhiễm sắc thể 5 (5q33.1)[5]
Chương 1 Tổng quan tài liệu
FGA là STR marker kiểu [TTTC] 3 TTTTTTCT[CTTT] n CTCC[TTCC] 2 nằm trong intron thứ 3 của genalpha fibrinogen thuộc vạch phụ số 3 trong vạch 31 nhánh dài của nhiễm sắc thể 4 (4q31.3) [5]
Tuy nhiên, những STR nằm ngoài vùng gen chức năng người ta gọi tên theo thứ tự trên nhiễm sắc thể ‘D’ viết tắt của DNA, số thứ tự kế tiếp là số thứ tự nhiễm sắc thể, S viết tắt của từ single copy sequence (trình tự lặp đơn) và dãy số cuối chính là số thứ tự của marker được phát hiện và mô tả của nhiễm sắc thể đó Chẳng hạn: D16S539 trong đó D: DNA, 16: nhiễm sắc thể 16, S: trình tự đơn (single copy sequence), 539 là số thứ tự của locus thứ 539 được phát hiện và mô tả trên nhiễm sắc thể 16
D3S1358 locus thứ 1358 được phát hiện và mô tả trên nhiễm sắc thể 3, chứa kiểu lặp lại của [AGAT], [TCTA]thuộc vạch 21.31 trên nhánh ngắn [45]
D7S820 nằm trên nhiễm sắc thể 7, locus thứ 820 và có đoạn lặp lại kiểu [GATA], thuộc vạch 21.11 trên nhánh dài [45]
D5S818 là đoạn DNA chứa kiểu lặp lại [AGAT] , 818 là số thứ tự của locus thứ 818 được phát hiện và mô tả trên nhiễm sắc thể 5, thuộc vạch 23.2 trên nhánh dài của nhiễm sắc thể 5 [45]
D8S1179 là marker chứa kiểu lặp lại [TATC] , thuộc vạch 24.13 của nhánh dài trên nhiễm sắc thể 8 và ở locus 1179 [45]
D13S317 locus thứ 317 được phát hiện và mô tả trên nhiễm sắc thể 13, chứa kiểu lặp lại của [GATA], [TATC] thuộc vạch 31.1 trên nhánh ngắn [45]
D21S11 là đoạn DNA chứa kiểu lặp lại [TCTA],[TCTG], 11 là số thứ tự của locus thứ 11 được phát hiện và mô tả trên nhiễm sắc thể 21, thuộc vạch 21.1 trên nhánh dài của nhiễm sắc thể 21 [45]
D18S51 là marker chứa kiểu lặp lại [GAAA] , thuộc vạch 21.33 của nhánh dài trên nhiễm sắc thể 18 và ở locus 51 [45]
D19S433 là STR marker kiểu [AGAT],[TCTA] thuộc vạch 12 trên nhánh dài nhiễm sắc thể 19 và ở locus 433 [45]
D2S1338 là đoạn DNA chứa kiểu lặp lại [TGCC] n ,[TTCC] n , thuộc vạch 35 của nhánh dài trên nhiễm sắc thể 2 và ở locus 1338 [45]
Penta E là đoạn DNA chứa kiểu lặp [AAAGA], thuộc vạch 26.2 của nhánh dài trên nhiễm sắc thể 15 [12], [45]
Penta D là đoạn DNA chứa kiểu lặp [AAAGA], thuộc vạch 22.3 của nhánh dài trên nhiễm sắc thể 21 [12], [45]
Hình 1.8 Bảng 13 tiêu chuẩn CODIS [43]
Trình tự STR không chỉ có chiều dài và số lượng của đơn vị lặp thay đổi mà còn có quy luật nhất định tạo thành mẫu hình nhất định Tùy theo mẫu hình tạo thành, người ta phân nhóm chúng theo các kiểu sau: (i) Đơn vị lặp đơn chứa kiểu lõi lặp có chiều dài và trình tự đồng nhất (ii) Đơn vị lặp ghép gồm ít nhất 2 đơn vị lặp đơn (iii) Đơn vị lặp phức chứa những đoạn lặp có trình tự và chiều dài biến động (iv) Đơn vị lặp phức siêu biến chứa những alen không thống nhất, nghĩa là những alen này có sự khác biệt cả chiều dài và trình tự [30] Đây là kiểu STR marker không được dùng rộng rãi trong định kiểu DNA pháp y Tuy vậy ngay cả kiểu đơn vị lặp đơn cũng có những alen chứa lõi lặp không hoàn chỉnh
Chương 1 Tổng quan tài liệu
Hình 1.9 Các kiểu trình tự lặp của STR [46]
1.5.2 Kỹ thuật multiplex PCR-STR Đây là kỹ thuật cao đòi hỏi phải có quá trình tối ưu hóa, tiêu tốn nhiều thời gian, công sức và tiền bạc nhưng nó mang lại ưu thế và sự tiện lợi rất lớn cho ứng dụng thực tiễn lâm sàng cũng như pháp y Trong lĩnh vực pháp y, kỹ thuật đa mồi được Applied Biosystems và Promega ứng dụng thành bộ kit hoàn chỉnh Với chỉ 1 lần chạy phản ứng khuếch đại, các phòng thí nghiệm có thể thu được hồ sơ DNA cá thể với 16 vùng STR trên các nhiễm sắc thể khác nhau với độ chính xác rất cao
Sự ra đời các kit khuếch đại STR multiplex đã thực sự có ý nghĩa rất lớn trong cuộc cách mạng khoa học pháp y về DNA Kit STR multiplex thế hệ thứ nhất được FSS đưa ra với 4 locus TH01, FES/FPS, VWA và F13A1, khả năng đối chiếu khoảng 1:10 4 Tiếp đó FSS lại cho ra kit STR multiplex thế hệ thứ hai gồm marker xác định giới tính và 6 STRs đa hình TH01, VWA, FGA, D8S1179, D18S51, D21S11 với khả năng đối chiếu khoảng 1:5x10 7 Hiện nay thị trường càng có nhiều kit cho phép khuếch đại đồng thời đến 16 marker STR trong một phản ứng với lượng DNA chỉ cần 1ng (hoặc ít hơn), khả năng phân biệt lên đến 1: 10 17 và kết quả thu được chỉ trong vài giờ
1.5.3 Kỹ thuật điện di mao quản tự động
Hệ thống điện di mao quản tự động bao gồm một ống mao quản, hai lọ chứa dung dịch đệm, hai điện cực nối với nguồn điện thế cao (5-20kV), nguồn kích thích bằng tia laser, đầu dò huỳnh quang, khay mẫu tự động và máy tính Mao quản được làm từ silica núng chảy (thuỷ tinh), đường kớnh bờn trong khoảng 50-100àm, chiều dài 25-75 cm Khi ứng dụng vào giám định hồ sơ DNA hiện nay người ta thường sử dụng hệ thống điện di đa mao quản để có thể thu được kết quả sớm nhất
Hình 1.10 Kỹ thuật điện di mao quản tự động [4]
1.5.4 Kỹ thuật phân tích hồ sơ DNA
Trong quá trình khuếch đại các alen STR, một số hiện tượng thường gặp gây khó khăn cho việc phân tích và diễn giải kiểu hình của các alen hiện diện trong mẫu DNA đích như stutter products (xuất hiện các đỉnh phụ bên cạnh đỉnh alen chính) và non- template addition Ngoài ra còn có một số yếu tố khác cũng ảnh hưởng đến kết quả hồ sơ DNA bao gồm: microvariants (vi biến), tri-allelic patterns (kiểu 3 alen), alen dropout (mất alen) và mutation (đột biến)
• Các sản phẩm lặp (Stutter products):
Chương 1 Tổng quan tài liệu
Hình 1.11 Hình ảnh stutter của một vài alen [4]
Cơ chế giải thích sự xuất hiện các sản phẩm lặp lại là do sự bắt cặp lỗi trượt-sợi (slipped-strDNA mispairing) [16], [33] Trong kiểu slipped-strDNA mispairing, một vùng nào đó của phức hợp primer-template trở nên không bắt cặp được, dẫn đến hiện tượng mồi hoặc sợi khuôn của đoạn trình tự lặp tự tạo thành vòng non-base-paired [16] Từ đó, vòng lặp lại là sản phẩm PCR có kích thước ngắn hơn alen STR khuếch đại ban đầu một đơn vị lặp lại đơn
Hình 1.12 Cơ chế liên quan việc hình thành đỉnh phụ nhỏ [4]
Trang 22 Các stutter ảnh hưởng phần nào đến việc giải thích kết quả hồ sơ DNA, đặc biệt trong trường hợp hai hoặc nhiều cá thể có thể đã góp phần vào mẫu DNA cần phân tích Bởi vì khi các sản phẩm stutter có kích thước tương tự như các sản phẩm PCR thực thì khó xác định được đâu là stutter của alen kế cận và đâu là đỉnh alen thực? Có thể tóm tắt một số nét nhận dạng stutter như sau :
- Một đỉnh nhỏ và xuất hiện ngay trước đỉnh alen chính tương ứng ;
- Tỷ lệ phần trăm chiều cao giữa đỉnh stutter và đỉnh alen tương ứng với nó thường thấp hơn 15%
- Lượng stutter tùy thuộc vào loại locus cũng như điều kiện PCR và polymerase đã sử dụng ;
- Xu hướng các stutter sẽ giảm xuất hiện với các đơn vị lặp lại dài hơn (pentanucleotides