III. NGÀY GIAO NHIỆM VỤ : 24-06-
1. TỔNG QUAN
1.3.2. Enzyme Amplitaq Gold Polymerase
Enzyme AmpliTaq Gold™ DNA polymerase là enzyme quan trọng cho phản ứng STR-PCR vì nó đã được sửa đổi hóa học để duy trì trạng thái bất hoạt ở nhiệt độ thường [3]. Enzym này được kích hoạt trở lại trước khi thực hiện phản ứng PCR nhờ thêm bước tăng nhiệt độ lên 95oC trong 10 hoặc 11 phút. Ở pH dưới 7, hoạt tính polymerase được phục hồi. Dung dịch Tris trong phản ứng PCR có độ nhạy pH thay đổi theo nhiệt độ. Mỗi 10C tăng lên làm cho pH giảm khoảng 0,02 đơn vị [18]. Dung dịch đệm Tris có pH 8,3 ở 250C sẽ giảm xuống khoảng 6,9 ở 950C, do đó không chỉ DNA mạch khuôn biến tính mà hoạt tính polymerase của TaqGold cũng được kích hoạt. Vì vậy, TaqGold phù hợp nhất khi dùng dung dịch đệm Tris có pH 8,0 hoặc 8,3 ở 250C. AmpliTaq Gold không phù hợp với phản ứng PCR có dung dịch đệm pH 9,0 thường được dùng cho AmpliTaq DNA polymerase thông thường [26] bởi TaqGold vẫn ở trạng thái bất hoạt vì pH giảm không đủ để có thể gây ra thay đổi hóa học trên cấu trúc phân tử lysine mà cụ thể là nhóm epsilon-amino [18].
1.3.3. Multiplex PCR trong STR-PCR
Phản ứng multiplex PCR khuếch đại cùng lúc hơn 2 vùng DNA bằng cách đơn giản thêm hơn một cặp mồi vào thành phần phản ứng và chúng phải tương thích với nhau. Nói một cách khác, nhiệt độ bắt cặp của mồi nên bằng nhau và chúng không chứa vùng bắt cặp bổ sung lẫn nhau nhằm tránh hiện tượng tự bắt vào nhau tạo thành dimer-primer thay vì bắt cặp vào mạch DNA đích. Cứ mỗi cặp mồi thêm vào phản ứng multiplex PCR làm gia tăng khả năng chúng tương tác lẫn nhau.
Ngoài sự thuận lợi là khuếch đại đồng thời được nhiều vùng DNA cùng một lúc thì multiplex PCR vẫn gặp phải những hạn chế như khi thiết kế không khéo sẽ tạo ra những sản phẩm không đặc trưng (mồi bắt chéo với nhau) đây là nhược điểm quan trọng nhất, hiện tượng stutter (nhược điểm thuộc về bản chất của kit thương mại). Ngoài ra, việc sử dụng loại enzyme Taq polymerase không đặc hiệu cho phản ứng cộng với nồng độ các cặp mồi không phù hợp thì amplicon có kích thước ngắn sẽ tạo ra nhiều hơn amplicon có kích thước dài, thậm chí những amplicon có kích thước dài từ 500bp trở lên có khả năng không thể tạo thành…
Chương 1. Tổng quan tài liệu
Trang 13
Mỗi thử nghiệm PCR hầu như yêu cầu mức độ tối ưu nhất định cả hóa chất lẫn chu kỳ luân nhiệt. Multiplex PCR cũng không ngoại lệ. Thực tế, việc tối ưu cho thử nghiệm multiplex PCR gặp nhiều thử thách hơn so với thử nghiệm PCR truyền thống bởi các cặp mồi phải cùng lúc bắt vào mạch khuôn mà không gây trở ngại cho nhau và cần kéo dài thời gian trong chu kỳ luân nhiệt để có thể sao chép hoàn toàn tất cả các vùng DNA mục tiêu. Trình tự và nồng độ mồi cùng với Magnesium thường đóng vai trò quan trọng trong phản ứng multiplex PCR. Ngoài ra cần đạt sự cân bằng giữa các sản phẩm PCR tạo ra do việc khuếch đại từ những vùng khác nhau trên DNA đích [22], [25]. Để thu được phản ứng đồng khuếch đại có mức cân bằng tốt các sản phẩm PCR tạo thành đôi khi phải thiết kế lại mồi và lặp lại thử nghiệm nhiều lần với các nồng độ mồi khác nhau.
Để tạo được phản ứng multiplex PCR tối ưu có sản phẩm khuếch đại đạt mức cân bằng tốt là một thách thức. Các phòng thí nghiệm pháp y hiếm khi thực hiện lại tối ưu hóa PCR bởi hiện nay các kit thương mại khả dụng vốn rất dồi dào.
1.3.4. Những thuận lợi và bất lợi của ứng dụng kỹ thuật PCR trong giám định mẫu
pháp y
Tốc độ phát triển các ứng dụng dùng PCR hiện nay đã tạo ra những thuận lợi nhất định cho việc phân tích DNA trong pháp y như là: (i) Khuếch đại đoạn DNA chuyên biệt thành hàng tỷ bản sao nhờ vào phản ứng multiplex. (ii) Chỉ cần dùng lượng cực nhỏ DNA thậm chí một tế bào. (iii) DNA bị thoái hóa thành những đoạn ngắn chỉ vài trăm cặp base cũng có thể làm mạch khuôn. (iv) DNA bị tạp nhiễm chẳng hạn từ vi khuẩn và nấm sẽ không được khuếch đại. (v) PCR được thương mại dưới dạng các kit đơn giản và rất dễ sử dụng [4].
Tuy nhiên, kỹ thuật này cũng gặp phải những vấn đề trở ngại nhất định. Chẳng hạn (i) DNA mạch khuôn sẽ không được khuếch đại nếu có chất ức chế PCR trong dung dịch ly trích. (ii) Phản ứng PCR sẽ không xảy ra nếu vùng gắn của mồi bị thay đổi. (iii) Tạp nhiễm DNA khác ngoài DNA đích từ quá trình thao tác (DNA kỹ thuật viên, DNA lần chạy trước…) [4].
Trang 14
1.4. Một số STR thường dùng hiện nay
1.4.1. Những đặc tính mong muốn của STR dùng trong pháp y
Trình tự lặp STR cũng được phân loại theo chiều dài của đơn vị lặp lại. Đơn vị lặp dinucleotide gồm 2 nucleotide lặp lại liên tục nhau thành một vùng nhất định. Trinucleotide có 3, tetranucleotide có 4, pentanucleotide có 5 và hexanucleotide có 6 nucleotide trong một nhóm lặp lại. Tuy nhiên, đơn vị lặp loại tetranucleotide trở thành marker STR phổ biến nhất dùng trong xác định cá thể nhờ những thuận lợi nhất định như sau:
+ Phổ kích thước alen hẹp cho phép multiplex
+ Phổ kích thước alen hẹp giảm hiện tượng mất alen do ưu thế khuếch đại alen kích thước nhỏ
+ Khả năng tạo thành các sản phẩm PCR có kích thước nhỏ nên rất thuận lợi cho những mẫu DNA bị thoái hóa
+ Giảm hiện tượng tạo thành các sản phẩm stutter so với đơn vị lặp 2 nucleotide. Điều này tạo điều kiện thuận lợi trong việc đọc kết quả mẫu tạp.
Trong những thập niên trước, người ta đã khám phá và ứng dụng tetranucleotide vào xác định cá thể [4]. Những vùng marker này phù hợp cho việc định kiểu gen cho những mẫu DNA thoái hóa, đặc tính tạo stutter thấp và STR nhiễm sắc thể Y để có thể phân tích hỗn hợp mẫu nam-nữ trong trường hợp xâm hại tình dục [8]. Chuẩn chọn vùng STR thích hợp cho ứng dụng xác định cá thể được Gill và cộng sự 1996, Carracedo và Lareu 1998 mô tả như sau:
+ Khả năng phân biệt tốt, thường >0,9 và dị hợp tử >0.7
+ Tách biệt vị trí trên nhiễm sắc thể tránh trường hợp liên kết vùng gen. + Cho kết quả rõ ràng khi chạy phản ứng multiplex
+ Đặc tính tạo stutter thấp + Tỷ lệđột biến thấp
+ Chiều dài của các alen ước đoán nằm trong khoảng 90-500bp với kích thước nhỏ hơn, phù hợp cho việc phân tích các mẫu DNA thoái hoá.
Chương 1. Tổng quan tài liệu
Trang 15
Để thuận tiện, các marker STR điển hình ứng dụng trong hồ sơ DNA thường được thiết kế trên các nhiễm sắc thể riêng biệt nhằm tránh những rắc rối do sự liên kết giữa các marker.
1.4.2. Những kit STR đã thương mại hóa
Năm 2001, Applied Biosystems đã giới thiệu hai kỹ thuật mới trong kit AmpFℓSTR®
Identifiler™. Kỹ thuật thứ nhất liên quan đến việc sử dụng hệ thống phát hiện 5 màu huỳnh quang trong đó 4 màu khác biệt (6FAM™, VIC™, NED™ và PET™) được sử dụng để đánh dấu các sản phẩm khuếch đại chính xác hơn 3 màu (5FAM, JOE, NED hoặc FL, JOE, TMR) trong các kit AmpFℓSTR hoặc PowerPlex đã dùng trước đây. Kênh phát hiện 1 màu luôn được dùng làm kích thước nội chuẩn trong điện di nhằm xác định rõ kích thước sản phẩm PCR. Do vậy, màu thứ 5 (LIZ™) trong hệ thống phát hiện 5 màu và màu thứ 4 (ROX hoặc CXR) trong hệ thống phát hiện 4 màu được sử dụng nhằm đánh dấu kích thước nội chuẩn.
Hình 1.7. Mồi được gắn thêm đuôi hiệu chỉnh [4]
Kỹ thuật thứ hai được giới thiệu trong bộ kit Identifiler™ liên quan đến việc bổ sung vùng hiệu chỉnh có bản chất non-nucleotide, được cấu tạo từ các hexaethyleneoxide (HEO), mỗi đơn vị HEO dài khoảng 2.5 nucleotide. Các liên kết non-nucleotide được hình thành giữa màu huỳnh quang và đầu 5’ của trình tự mồi. Trong quá trình khuếch đại, màu huỳnh quang và liên kết sẽ hợp nhất tạo thành amplicon. Trong quá trình điện di, việc thêm các liên kết non-nucleotide vào sẽ làm cho các alen STR được nâng lên thành
Trang 16
kích thước lớn và rõ hơn, khoảng trống giữa các STR locus đã được đánh dấu cùng màu huỳnh quang được tối ưu hoá, không thay đổi vị trí gắn kết mồi PCR (Hình 1.7) [4].
1.5. Các kỹ thuật sử dụng trong việc tạo hồ sơ DNA
1.5.1. Đặc điểm 18 locus STR được khảo sát
Để các marker trong hồ sơ DNA có giá trị pháp lý cao, các nhà nghiên cứu luôn phải sử dụng bộ marker chuẩn. Hiện nay, các STR locus thông dụng thường mang nét đặc trưng và phát triển khởi đầu hoặc từ phòng thí nghiệm của tiến sĩ Thomas Caskey tại trường Y khoa Baylor [11]; [15] hoặc từ Sở Khoa học Pháp Y (FSS-Forensic Science Service) tại Anh [23]; [32]. Promega (Madison, Wisconsin) thương mại hóa nhiều marker của Caskey trong khi Applied Biosystems (Foster City, California) lại chọn các STR locus của Sở Khoa học Pháp Y (FSS) để phát triển một số marker mới.
Tên STR marker được đặt tùy vào vị trí marker nằm trong hay ngoài một gen. Nếu marker rơi vào vùng gen chức năng hoặc một phần của gen, tên gen được dùng cho marker ví dụ:
TH01 trong đó TH là viết tắt từ tên gen tyrosine hydroxylase nằm trên nhiễm sắc thể
11 và số 01 là vùng intron đầu tiên của gen này có chứa đoạn lặp lại kiểu[AATG] và [TCAT] thuộc vạch 15.5 trên cánh ngắn của nhiễm sắc thể thứ 11 (11p15.5) [5].
vWA là đoạn DNA chứa kiểu lặp lại của [AGAT], [TCTA], [TCTG] và [TCCA] nằm
trong intron thứ 40 của nhân tố von WillebrDNA thuộc vạch 13.31 trên cánh ngắn của nhiễm sắc thể thứ 12 (12p13.31) [5].
TPOX là marker chứa kiểu lặp lại của [AATG] nằm trong vùng intron thứ 10 của
thyroid peroxidase gen thuộc vạch phụ thứ 3 trong vạch 25 trên cánh ngắn của nhiễm sắc thể thứ 2 (2p25.3) [5].
CSF1PO là vùng DNA chứa kiểu [AGAT] thuộc intron thứ 6 của gen c-fms proto-
oncogen for CSF-1 receptor nằm trong vạch 33.1 của cánh dài nhiễm sắc thể 5 (5q33.1)
Chương 1. Tổng quan tài liệu
Trang 17
FGA là STR marker kiểu [TTTC]3TTTTTTCT[CTTT]nCTCC[TTCC]2 nằm trong
intron thứ 3 của genalpha fibrinogen thuộc vạch phụ số 3 trong vạch 31 nhánh dài của nhiễm sắc thể 4 (4q31.3) [5].
Tuy nhiên, những STR nằm ngoài vùng gen chức năng người ta gọi tên theo thứ tự trên nhiễm sắc thể. ‘D’ viết tắt của DNA, số thứ tự kế tiếp là số thứ tự nhiễm sắc thể, S viết tắt của từ single copy sequence (trình tự lặp đơn) và dãy số cuối chính là số thứ tự của marker được phát hiện và mô tả của nhiễm sắc thể đó. Chẳng hạn: D16S539 trong đó D: DNA, 16: nhiễm sắc thể 16, S: trình tự đơn (single copy sequence), 539 là số thứ tự của locus thứ 539 được phát hiện và mô tả trên nhiễm sắc thể 16.
D3S1358 locus thứ 1358 được phát hiện và mô tả trên nhiễm sắc thể 3, chứa kiểu
lặp lại của [AGAT], [TCTA]thuộc vạch 21.31 trên nhánh ngắn [45].
D7S820 nằm trên nhiễm sắc thể 7, locus thứ 820 và có đoạn lặp lại kiểu [GATA],
thuộc vạch 21.11 trên nhánh dài [45].
D5S818 là đoạn DNA chứa kiểu lặp lại [AGAT] , 818 là số thứ tự của locus thứ 818
được phát hiện và mô tả trên nhiễm sắc thể 5, thuộc vạch 23.2 trên nhánh dài của nhiễm sắc thể 5 [45].
D8S1179 là marker chứa kiểu lặp lại [TATC] , thuộc vạch 24.13 của nhánh dài trên
nhiễm sắc thể 8 và ở locus 1179 [45].
D13S317 locus thứ 317 được phát hiện và mô tả trên nhiễm sắc thể 13, chứa kiểu
lặp lại của [GATA], [TATC] thuộc vạch 31.1 trên nhánh ngắn [45].
D21S11 là đoạn DNA chứa kiểu lặp lại [TCTA],[TCTG], 11 là số thứ tự của locus
thứ 11 được phát hiện và mô tả trên nhiễm sắc thể 21, thuộc vạch 21.1 trên nhánh dài của nhiễm sắc thể 21 [45].
D18S51 là marker chứa kiểu lặp lại [GAAA] , thuộc vạch 21.33 của nhánh dài trên
nhiễm sắc thể 18 và ở locus 51 [45].
D19S433 là STR marker kiểu [AGAT],[TCTA] thuộc vạch 12 trên nhánh dài nhiễm
Trang 18
D2S1338 là đoạn DNA chứa kiểu lặp lại [TGCC]n,[TTCC]n , thuộc vạch 35 của
nhánh dài trên nhiễm sắc thể 2 và ở locus 1338 [45].
Penta E là đoạn DNA chứa kiểu lặp [AAAGA], thuộc vạch 26.2 của nhánh dài trên
nhiễm sắc thể 15 [12], [45].
Penta D là đoạn DNA chứa kiểu lặp [AAAGA], thuộc vạch 22.3 của nhánh dài trên
nhiễm sắc thể 21 [12], [45].
Hình 1.8. Bảng 13 tiêu chuẩn CODIS [43]
Trình tự STR không chỉ có chiều dài và số lượng của đơn vị lặp thay đổi mà còn có quy luật nhất định tạo thành mẫu hình nhất định. Tùy theo mẫu hình tạo thành, người ta phân nhóm chúng theo các kiểu sau: (i) Đơn vị lặp đơn chứa kiểu lõi lặp có chiều dài và trình tựđồng nhất. (ii) Đơn vị lặp ghép gồm ít nhất 2 đơn vị lặp đơn. (iii) Đơn vị lặp phức chứa những đoạn lặp có trình tự và chiều dài biến động. (iv) Đơn vị lặp phức siêu biến chứa những alen không thống nhất, nghĩa là những alen này có sự khác biệt cả chiều dài và trình tự [30]. Đây là kiểu STR marker không được dùng rộng rãi trong định kiểu DNA pháp y. Tuy vậy ngay cả kiểu đơn vị lặp đơn cũng có những alen chứa lõi lặp không hoàn chỉnh.
Chương 1. Tổng quan tài liệu
Trang 19
Hình 1.9. Các kiểu trình tự lặp của STR [46]
1.5.2. Kỹ thuật multiplex PCR-STR
Đây là kỹ thuật cao đòi hỏi phải có quá trình tối ưu hóa, tiêu tốn nhiều thời gian, công sức và tiền bạc nhưng nó mang lại ưu thế và sự tiện lợi rất lớn cho ứng dụng thực tiễn lâm sàng cũng như pháp y. Trong lĩnh vực pháp y, kỹ thuật đa mồi được Applied Biosystems và Promega ứng dụng thành bộ kit hoàn chỉnh. Với chỉ 1 lần chạy phản ứng khuếch đại, các phòng thí nghiệm có thể thu được hồ sơ DNA cá thể với 16 vùng STR trên các nhiễm sắc thể khác nhau với độ chính xác rất cao.
Sự ra đời các kit khuếch đại STR multiplex đã thực sự có ý nghĩa rất lớn trong cuộc cách mạng khoa học pháp y về DNA. Kit STR multiplex thế hệ thứ nhất được FSS đưa ra với 4 locus TH01, FES/FPS, VWA và F13A1, khả năng đối chiếu khoảng 1:104. Tiếp đó FSS lại cho ra kit STR multiplex thế hệ thứ hai gồm marker xác định giới tính và 6 STRs đa hình TH01, VWA, FGA, D8S1179, D18S51, D21S11 với khả năng đối chiếu khoảng 1:5x107. Hiện nay thị trường càng có nhiều kit cho phép khuếch đại đồng thời đến 16 marker STR trong một phản ứng với lượng DNA chỉ cần 1ng (hoặc ít hơn), khả năng phân biệt lên đến 1: 1017 và kết quả thu được chỉ trong vài giờ.
Trang 20
1.5.3. Kỹ thuật điện di mao quản tựđộng
Hệ thống điện di mao quản tự động bao gồm một ống mao quản, hai lọ chứa dung dịch đệm, hai điện cực nối với nguồn điện thế cao (5-20kV), nguồn kích thích bằng tia laser, đầu dò huỳnh quang, khay mẫu tựđộng và máy tính. Mao quản được làm từ silica nóng chảy (thuỷ tinh), đường kính bên trong khoảng 50-100|m, chiều dài 25-75 cm. Khi ứng dụng vào giám định hồ sơ DNA hiện nay người ta thường sử dụng hệ thống điện di đa mao quản để có thể thu được kết quả sớm nhất.
Hình 1.10. Kỹ thuật điện di mao quản tựđộng [4]
1.5.4. Kỹ thuật phân tích hồ sơ DNA
Trong quá trình khuếch đại các alen STR, một số hiện tượng thường gặp gây khó khăn cho việc phân tích và diễn giải kiểu hình của các alen hiện diện trong mẫu DNA đích như stutter products (xuất hiện các đỉnh phụ bên cạnh đỉnh alen chính) và non- template addition. Ngoài ra còn có một số yếu tố khác cũng ảnh hưởng đến kết quả hồ sơ DNA bao gồm: microvariants (vi biến), tri-allelic patterns (kiểu 3 alen), alen dropout (mất alen) và mutation (đột biến).
Chương 1. Tổng quan tài liệu
Trang 21
Hình 1.11. Hình ảnh stutter của một vài alen [4]
Cơ chế giải thích sự xuất hiện các sản phẩm lặp lại là do sự bắt cặp lỗi trượt-sợi (slipped-strDNA mispairing) [16], [33]. Trong kiểu slipped-strDNA mispairing, một vùng nào đó của phức hợp primer-template trở nên không bắt cặp được, dẫn đến hiện tượng mồi hoặc sợi khuôn của đoạn trình tự lặp tự tạo thành vòng non-base-paired [16]. Từđó, vòng lặp lại là sản phẩm PCR có kích thước ngắn hơn alen STR khuếch đại ban đầu một đơn vị lặp lại đơn.
Trang 22
Các stutter ảnh hưởng phần nào đến việc giải thích kết quả hồ sơ DNA, đặc biệt trong