CÁC LOCUT STR TRONG HỆ GEN NGƯỜI VÀ ỨNG DỤNG CỦA C- 123docz.net

DỤNG CỦA CHÚNG TRONG NHẬN DẠNG CÁ THỂ

1.3.1. Khái niệm các đoạn lặp và STR

Khi nghiên cứu về cấu trúc ADN của sinh vật nhân chuẩn và một số sinh vật nhân sơ người ta thấy các đoạn mã hóa và các đoạn khơng mã hóa. Trong các đoạn khơng mã hố chứa các trình tự lặp lại. Các đoạn ADN chứa trình tự lặp lại này khác nhau về kích thước. Chúng mang tính đặc trưng về chiều dài các đơn vị lặp lại và số lượng những đơn vị lặp lại liên tục trên toàn bộ chiều dài đoạn ADN. Người ta chia các trình tự này làm 3 loại [23].

- Các trình tự lặp lại nhiều lần chiếm 10 - 15% bộ gen người. Đó là những trình tự lặp lại có kích thước khoảng 10 - 20kb, thường tập trung ở vùng tâm động hoặc ở đầu nhiễm sắc thể.

gen người. Chúng có kích thước lớn hơn (100 - 1000bp) và đa dạng hơn những trình tự lặp lại nhiều lần, các trình tự này khơng tập trung mà phân tán trên tồn bộ hệ gen.

- Các trình tự đơn: đó là các trình tự mã hóa cho các protein, có trình tự đặc trưng cho từng gen.

Các đoạn ADN có các trình tự lặp từ 10 - 100 nucleotit gọi là VNTR, ví dụ locut D1S80 có đoạn lặp là bội số của 16 nucleotit, locut này chứa các alen từ số đơn vị lặp lại 14 lần đến 41 lần. Trình tự lặp lại là GAGGA CCACCAGGAAG.

Các đoạn ADN có cấu trúc lặp lại từ 2 - 6bp được gọi là các đoạn lặp lại ngắn (STR). Các cấu trúc VNTR hay STR mang tính bảo thủ cao, được di truyền qua các thế hệ và tính đặc trưng cá thể. Các VNTR và STR có thể được nhân bội bằng phản ứng PCR.

1.3.2. Cơ sở khoa học của phân tích STR trong nhận dạng cá thể và xác định huyết thống

Năm 1956, Joe Hin Tjio và Albert Levan đã xác định chính xác ở người, trong nhân tế bào (thể lưỡng bội) có 46 cặp nhiễm sắc thể được xếp thành 23 cặp tương đồng: 22 cặp nhiễm sắc thể thường và một cặp nhiễm sắc thể giới tính . Riêng tế bào trứng và tinh trùng chỉ có 23 nhiễm sắc thể (tế bào đơn bội). Sự kết hợp giữa trứng và tinh trùng đã duy trì được số lượng nhiễm sắc thể trong tế bào thường là 46. Bộ nhiễm sắc thể được bảo tồn và di truyền từ thế hệ này sang thế hệ khác. Thế hệ con cái bao giờ cũng thừa hưởng các đặc tính di truyền thơng qua gen của cả bố và mẹ với xác suất ngang nhau. Điều đó có nghĩa là 23 nhiễm sắc thể từ bố được truyền cho con thông qua tinh trùng, 23 nhiễm sắc thể từ mẹ truyền cho con thông qua trứng. Các locut STR nằm trên nhiễm sắc thể cũng theo đó mà được di truyền qua các thế hệ (hình 1.1).

Hình 1.1. Sơ đồ minh hoạ các khả năng di truyền

một số alen thuộc locut STR từ bố, mẹ cho con theo định luật Mendel

(8 - 12: một số alen thuộc locut STR [23]) 1.3.3. Cấu trúc của STR và danh pháp quốc tế

Tên các locut chỉ thị ADN được đặt theo tên của gen nếu locut này

nằm ở một phần hoặc nằm toàn bộ trong gen [23]; ví dụ locut TH01 ở gen tyrosine hydroxylase của người nằm trên nhiễm sắc thể số 11. Chữ "TH" xuất phát từ chữ cái đầu Tyrosine hydroxylase. Phần "01" của ký hiệu "TH01" xuất phát từ vùng intron 1 (vùng khơng mã hóa protein) của gen Tyrosine hydroxylase. Đôi khi tiếp đầu ngữ HUM được thêm vào đầu danh pháp của locut này để xác định đó là từ bộ gen người (human). Vì vậy locut STR này sẽ được gọi chính là HUM TH01 hay TH01.

Các chỉ thị ADN mà nằm ngồi vùng gen thì được xác định bởi vị trí của chúng trên nhiễm sắc thể. Ví dụ, STR locut D5S818 và DYS19 đó là những locut không nằm trong vùng gen. Trong trường hợp này chữ "D" có nghĩa là ADN. Con số tiếp theo là số thứ tự của nhiễm sắc thể. Chữ "S" thực chất là trình tự đơn lẻ của ADN. Con số cuối cùng là vị trí locut nằm trên mỗi nhiễm sắc thể riêng biệt. Con số này là duy nhất đối với mỗi locut ADN sử dụng trong nhận dạng cá thể. Ví dụ, locut D16S539 có nghĩa là D: ADN; 16: Nhiễm sắc thể số 16; S: single copy sequence; 539: vị trí thứ 539 được xác định trên nhiễm sắc thể 16.

Các trình tự STR được đặt tên dựa trên độ dài của đơn vị lặp. Trình tự lặp lại 2 nucleotit có các nucleotit lặp lại liên tục gần nhau. Trình tự lặp lại 3 nucleotit có 3 nucleotit trong một đơn vị lặp. Tương tự đối với các trình tự lặp lại 4, 5, 6 cũng có 4, 5, 6 nucleotit trong một đơn vị lặp tương ứng.

Bố (8-11) Mẹ (9-12) Con 1 (8-9) Con 2 (8-12) Con 3 (9-11) Con 4 (11-12)

Về mặt lý thuyết, có 4, 16, 64, 256, 1024, 4096 khả năng hình thành các kiểu cấu trúc (motif) đối với các trình tự lặp 1, 2, 3, 4, 5 và 6 nucleotit tương ứng . Tuy nhiên do các microsatellite có tính chất lặp lại ngẫu nhiên nên một số dạng cấu trúc được coi là giống nhau. Hiện nay trình tự lặp lại 4 nucleotit (tetranucleotide) được sử dụng phổ biến trong nhận dạng cá thể

người.

Các trình tự STR rất đa dạng về chiều dài đoạn lặp và số lượng đoạn lặp. Chúng được chia thành nhiều kiểu khác nhau dựa trên kiểu cấu trúc lặp [23, 25].

- Kiểu lặp lại đơn giản (simple repeats) có đơn vị lặp giống nhau về

chiều dài và trình tự.

- Kiểu lặp phức (compound repeats) bao gồm hai hoặc nhiều hơn các

đơn vị lặp lại đơn giản liền kề nhau.

- Kiểu lặp lại phức tạp (complex repeats) có thể bao gồm các khối lặp lại

có chiều dài và trình tự đơn vị lặp khác nhau và các trình tự khơng lặp lại xen kẽ .

- Kiểu lặp lại siêu biến (complex hypervariable repeats) mang vô số các

alen không đồng nhất, các alen này khác nhau về cả kích thước và trình tự do đó rất khó xác định kiểu gen. Loại này khơng được sử dụng phổ biến trong phân tích hình sự do khó khăn trong việc đặt tên cho các alen và thống nhất giữa các phịng thí nghiệm, mặc dù đã có 2 bộ kit

thương mại có chứa locut này là SE33, cịn gọi là ACTBP2 [23].

Không phải tất cả các alen của locut STR đều mang đơn vị lặp lại hoàn

hảo. Thậm chí cả kiểu đơn vị lặp lại đơn giản (simple repeats) cũng mang

những alen không đồng nhất, các alen này nằm xen giữa các alen có đơn vị

lặp lại đầy đủ. Những alen này được gọi là các biến thể (microvariants). Allen

9,3 của locut TH01 là một ví dụ. Alen này bao gồm 9 đơn vị lặp lại 4 nucleotit và 1 đơn vị lặp lại khơng hồn tồn chứa 3 nucleotit do đơn vị lặp lại số 7 bị mất 1 nucleotit andenin, khác với các đơn vị lặp bình thường AATG. 1.3.4. Vai trị của các STR trong phân tích hình sự

Các locut STR trở thành các chỉ thị ADN phổ biến bởi đặc tính dễ dàng nhân bội đồng thời qua phản ứng PCR, không phải thực hiện nhân bội riêng

rẽ như đối với các locut VNTR. Đặc điểm này là do các alen của locut STR nằm trong một khoảng kích thước tương đương, khoảng vài trăm bp, các đơn vị lặp lại có kích thước nhỏ. Hơn nữa, số đơn vị lặp của các chỉ thị STR rất khác nhau giữa các cá thể, điều này làm cho chúng trở thành công cụ hữu hiệu trong nhận dạng cá thể.

Với mục đích sử dụng cho nhận dạng cá thể, điểm quan trọng đối với

các chỉ thị ADN là có tính đa hình càng cao càng tốt hoặc một số chỉ thị có tính đa hình thấp hơn có thể kết hợp với các chỉ thị khác để đạt được đủ độ tin cậy phân biệt giữa các cá thể.

Một hạn chế đối với các mẫu hình sự là việc nhân bội gặp khó khăn do ADN trong mẫu có thể bị phân huỷ mạnh (tạo thành các đoạn nhỏ). Những hỗn hợp gồm nhiều mẫu (mẫu lẫn) thường có mặt nhiều trong các vụ án như mẫu thu từ các vụ xâm hại tình dục mang các vật liệu sinh học từ cả thủ phạm và nạn nhân. Kích thước alen nhỏ của các locut STR (khoảng 100-400bp) so với các alen của VNTR (khoảng 400-1000bp) khiến các STR dễ dàng được lựa chọn hơn cho mục đích ứng dụng trong hình sự phù hợp với các mẫu ADN biến tính.

Hơn nữa, việc phân tách các bazơ nitơ của các đoạn ADN có thể thực hiện dễ dàng với các đoạn có kích thước dưới 500bp khi sử dụng kỹ thuật điện di trên gel polyacrylamide biến tính. Vì vậy, về mặt sinh học và cơng nghệ, các chỉ thị STR với kích thước nhỏ hơn có ưu điểm hơn so với các chỉ thị VNTR có kích thước lớn.

Trong số các dạng lặp khác nhau của hệ STR, các đoạn lặp 4 nucleotit được sử dụng phổ biến hơn các đoạn lặp hai hoặc ba nucleotit. Dạng lặp 5 và 6 nucleotit ít phổ biến hơn trong genome người.

Sử dụng các STR có đơn vị lặp 4 nucleotit (tetranucleotide STR) trong hình sự có những thuận lợi so với các VNTR hoặc các STR 2 và 3 nucleotit vì:

- Khoảng kích thước giữa các alen nhỏ vừa phải phù hợp cho phản ứng PCR phức.

- Khoảng kích thước giữa các alen nhỏ vừa phải làm giảm khả năng mất alen đối với các alen có kích thước nhỏ hơn.

- Khả năng tạo ra các sản phẩm PCR có kích thước nhỏ thuận lợi cho việc phân tích các mẫu ADN đã biến tính.

- Việc giảm các sản phẩm “stutter” (băng giả) so với các dinucleotit thuận lợi cho việc đọc kiểu gen đối với các mẫu lẫn.

Các tiêu chí để lựa chọn locut STR ứng dụng cho nhận dạng cá thể như

sau: [23].

- Khả năng phân biệt cá thể cao, thường là trên 90% với tỷ lệ dị hợp tử trên 70%.

- Nằm ở các vị trí riêng biệt trên NST để đảm bảo không lựa chọn các locut liên kết. Để thuận lợi, các STR được lựa chọn thường nằm trên các NST riêng rẽ.

- Có thể phối hợp tốt với các chỉ thị khác trong phản ứng multiplex

- Tỷ lệ “stutter” thấp.

- Tỷ lệ đột biến thấp.

Độ dài các alen khoảng từ 90 đến 500bp, các kích thước alen nhỏ phù hợp cho việc phân tích các mẫu ADN biến tính.

1.3.5. Vai trò của việc lựa chọn, phối hợp các locut STR khác nhau trong xác định huyết thống :

Hiện nay, có thể ứng dụng hệ các locut STR trên nhiễm sắc thể thường hay STR trên nhiễm sắc thể giới tính để xác định các mối quan hệ họ hàng, huyết thống như:

- Xác định các mối quan hệ huyết thống trực hệ (cha - mẹ - con): Sử dụng các locut STR trên nhiễm sắc thể thường.

- Xác định các mối quan hệ huyết thống không trực hệ :

+ Xác định huyết thống theo dòng cha: Sử dụng các locut STR trên nhiễm sắc thể Y (Y-STR).

+ Xác định huyết thống sử dụng các locut STR trên nhiễm sắc thể X (xác định huyết thống bà – cháu hay anh, chị em trong các trường hợp đặc biệt: khơng cịn cha, mẹ …).

Trong xác định huyết thống, việc lựa chọn và sử dụng locut STR nào và số lượng locut STR cần sử dụng là bao nhiêu sẽ quyết định độ chính xác đối với kết quả giám định. Để xác định độ chính xác của một trường hợp xác

định huyết thống (bố - mẹ - con), người ta thường dựa trên chỉ số PI (paternity index). Chỉ số PI được xác định dựa trên tần suất alen của locut STR khảo sát được trong quần thể [23]. PI sẽ được xác định đối với từng locut, sau đó cần tính tốn để xác định chỉ số tiếp theo là CPI (combined paternity index). Chỉ số CPI được tính như sau [97]:

CPI = PI(1) x PI (2) x ….PI (n), trong đó: PI: Chỉ số quan hệ huyết thống.

CPI: Chỉ số quan hệ huyết thống kết hợp.

PI (1), PI (2), PI (n): Chỉ số PI của locut thứ nhất, locut thứ hai và

locut thứ n.

Đây là chỉ số để xác định mối quan hệ huyết thống khi phối hợp PI của tất cả các locut STR đã phân tích. Chỉ số CPI thể hiện mối quan hệ huyết thống giữa hai cá thể được xác định. CPI càng cao, độ tin cậy càng lớn. Điều này có nghĩa muốn đạt được chỉ số CPI cao, cần có sự lựa chọn phối hợp đủ số lượng các locut STR với nhau, hơn nữa, các locut STR được lựa chọn cũng phải là các locut có tính đa hình tương đối cao trong quần thể.

Từ kết quả của chỉ số CPI, có thể xác định độ chính xác của trường hợp giám định huyết thống. Chỉ số CPI của ca xét nghiệm được công nhận là khác nhau đối với từng quốc gia. Tuy nhiên, thông thường để kết luận không loại trừ một trường hợp xác định huyết thống, chỉ số PI tối thiểu cần đạt là 100 [23, 97] .

Hiện nay, tại Việt Nam cũng như ở các nước trên thế giới, số lượng các locut được sử dụng để xác định huyết thống thông thường là từ 16 đến 24 locut [30, 35, 79].

CÁC LOCUT STR TRONG HỆ GEN NGƯỜI VÀ ỨNG DỤNG CỦA CHÚNG TRONG NHẬN DẠNG CÁ THỂ

CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIấN CỨU

CHƯƠNG 3 KẾT QUẢ NGHIấN CỨU VÀ BÀN LUẬN