* Đặc điểm di truyền và ứng dụng của DNA ty thể trong nghiên cứu quan hệ di truyền người
Nghiên cứu di truyền quần thể và tiến hóa ở các sinh vật nói chung và ở người nói riêng ln cần những cơng cụ mạnh, cho kết quả nhanh và chính xác. Từ những nghiên cứu đầu tiên sử dụng các chỉ thị nhóm máu ABO, rồi đến các chỉ thị là những gen trong nhân, đặc biệt là các gen liên quan đến miễn dịch như hệ thống gen HLA đã cho một số kết quả nhất định trong các nghiên cứu về đa dạng di truyền [60]. Tuy nhiên, việc sử dụng các gen trong nhân làm đối tượng nghiên cứu lại có một số nhược điểm. Gen nhân có tần số đột biến thấp, mặt khác chúng lại được di truyền từ cả bố và mẹ và bị phân ly qua mỗi thế hệ nên việc dị tìm tổ tiên và mối quan hệ di truyền của đoạn DNA nào đó trở nên rất khó khăn. Bởi vậy DNA ty thể với lợi thế tần số đột biến cao sẽ là công cụ hữu hiệu trong các nghiên cứu về di truyền quần thể [61].
Sự di truyền của DNA ty thể là sự di truyền tế bào chất. Đối với các gen nằm trong nhân của tế bào sinh vật nhân chuẩn, chúng tuân theo các quy luật vận động của nhiễm sắc thể trong các cơ chế phân bào. Nhưng hệ gen ty thể lại khơng tn theo những quy luật đó mà các tính trạng do chúng xác định có những kiểu di truyền riêng đặc trưng cho chúng và chính những đặc điểm di truyền này đã trở thành thế mạnh khiến DNA ty thể nhanh chóng trở thành đối tượng được nghiên cứu rộng rãi.
- Số lượng lớn: Hệ gen ty thể có rất nhiều bản sao trong một tế bào. Nếu như mỗi gen hay đoạn DNA trong nhân chỉ có 2 bản sao ở 2 nhiễm sắc thể tương đồng thì với hệ gen ty thể con số đó là hàng trăm tới hàng nghìn bản sao. Đặc điểm này cùng với việc DNA ty thể tồn tại ở dạng vòng và nằm trong tế bào chất nên việc tách chiết, thu nhận DNA ty thể dễ dàng hơn. Điều này đặc biệt có ý nghĩa trong trường hợp phân tích những mẫu sinh phẩm cịn sót lại sau hàng chục hay hàng trăm năm. DNA nhân do có cấu trúc mạch thẳng nên khơng bền, dễ bị phân huỷ, làm cho việc phân tích gặp nhiều khó
khăn. Trong khi đó, DNA ty thể mạch vịng, có kích thước nhỏ nên bền theo thời gian trong các mơ khó phân huỷ như mơ xương, răng và tóc.
- Di truyền theo dịng mẹ: ở động vật có vú, DNA ty thể được di truyền theo dòng mẹ [62]. Số lượng DNA ty thể ở noãn bào khoảng hơn 100.000 phân tử trong khi tinh trùng chỉ có từ 100 đến 1500 phân tử. Trong q trình tạo thành hợp tử, tế bào tinh trùng chỉ đóng góp hệ gen nhân của chúng cho tế bào trứng chứ khơng đóng góp hệ gen ty thể. Ty thể của tinh trùng bị loại bỏ ngay khi vào trứng có thể do q trình phân hủy protein phụ thuộc ubiquitin [63]. Do vậy, các cá thể cùng mẹ hoặc liên quan theo dòng mẹ chứa các bản sao DNA ty thể gần như giống nhau. Đặc tính này giúp cho việc tìm kiếm các dịng giống có quan hệ với nhau theo thời gian và tìm kiếm tổ tiên chung của một quần thể. Tuy nhiên, đôi khi cơ chế loại bỏ DNA ty thể của tinh trùng có thể bị hỏng, dẫn đến hiện tượng tế bào chất của hợp tử chứa nhiều loại DNA ty thể. Hiện tượng này được gọi là hiện tượng “dị tế bào chất” (heteroplasmy). - Đơn bội, khơng có sự tái tổ hợp, mặc dù enzyme tái tổ hợp ở ty thể có thể có chức năng. Nhìn chung hiện tượng tái tổ hợp là rất hiếm gặp và khơng đáng kể. Và do đó nếu khơng có mặt của các phân tử DNA dị tế bào chất thì các phân tử DNA ty thể của hợp tử không khác so với phân tử DNA ty thể ban đầu [64].
- Tốc độ đột biến lớn: Tốc độ đột biến thay thế trong hệ gen ty thể gấp khoảng 10 - 100 lần tốc độ đột biến trung bình của DNA nhân [65], [66]. Tốc độ đột biến của vùng điều khiển cao hơn vùng mã hóa, đặc biệt cao nhất ở 2 vùng siêu biến HV1 và HV2 [67]. Tốc độ đột biến này có thể là do trong q trình sao chép mắc nhiều lỗi và ty thể thiếu cơ chế để sửa chữa các sai hỏng như ở gen nhân [68]. Mặt khác, ty thể là nơi luôn diễn ra các q trình oxy hóa và do đó, sản sinh ra các chất oxy hóa mạnh như các gốc tự do. Các chất này sẽ tác động đến hệ gen của ty thể và phát sinh ra các đột biến. Do các đột biến là ngẫu nhiên nên bất kỳ bazơ nào trong hệ gen ty thể, cả ở vùng mã hóa
và khơng mã hóa, đều có thể bị thay đổi. Hơn nữa do các tế bào đều có hàng trăm đến hàng nghìn DNA ty thể nên các đột biến DNA ty thể có hại có thể xảy ra ở tất cả các mơ, sinh dưỡng và sinh dục. Các đột biến bắt nguồn ở các mô sinh dưỡng (somatic tissue) làm giảm việc sản xuất năng lượng cho tế bào và những người bị các đột biến này thường sẽ chết. Còn các đột biến bắt nguồn từ tế bào sinh dục của mẹ và được truyền cho thế hệ sau thì được xem là các đa hình DNA ty thể [50].
Nhờ đặc tính chọn lọc vơ tính hoặc gần như vơ tính nên các dạng DNA ty thể khác nhau khơng bị loại bỏ trong q trình chọn lọc và do đó chúng trở nên phổ biến do sự trôi dạt di truyền. Do DNA ty thể được di truyền theo mẫu hệ nên nó tích luỹ các đột biến và phát tán theo các dòng phả hệ mẫu hệ. Chính điều này đã tạo nên tính đa hình của DNA ty thể, đặc trưng theo quần thể, tạo nên các nhóm kiểu đơn của DNA ty thể có quan hệ với nhau, hay cịn gọi là nhóm đơn bội (Haplogroup).
Từ các nghiên cứu đầu tiên về đa hình DNA ty thể người sử dụng kỹ thuật RFLP và trình tự đoạn siêu biến trên vùng điều khiển D-loop của DNA ty thể, người ta thấy rằng các loại DNA ty thể khác nhau có thể xếp vào các nhóm đơn bội khác nhau dựa trên sự có mặt và vắng mặt các băng khi cắt DNA ty thể bằng một enzyme giới hạn nào đó và dựa trên trình tự đặc trưng của vùng điều khiển. Theo đó mỗi nhóm đơn bội có một bộ các đa hình
nucleotide đơn (Single Nucleotide Polymorphisms – SNPs) đặc trưng và
thường đi kèm với nhóm đơn bội đó. Việc phân loại và sắp xếp các nhóm đơn bội sẽ giúp phân tích các dịng DNA ty thể theo phả hệ, từ đó có thể dựng lại q trình tiến hóa và nghiên cứu mối quan hệ di truyền của người. Dựa trên số liệu RFLP người ta đã phân loại DNA ty thể thành 4 nhóm đơn bội đối với người Phi là L0, L1, L2 và L3. Ba nhóm L0, L1, L2 chiếm 76% dân số Châu Phi và được đặc trưng bởi điểm cắt giới hạn HpaI ở vị trí 3592. Ở Đơng Bắc Phi, 2 dịng DNA ty thể M và N xuất hiện từ nhóm L3 khoảng 65.000 năm
trước đây và là tổ tiên của tất cả các dòng DNA ty thể trên lục địa Á, Âu. Ở Châu Âu, nhóm L3 và N tạo nên 9 nhóm đơn bội là H, I, J, K, T, U, V, W, X. Ở Châu Á, 2 nhóm đơn bội lớn là M và N phân li tạo nên các nhóm đơn bội nhỏ hơn. Từ N tạo nên các nhóm A, B, F và các nhóm khác; từ M phân chia thành các nhóm C, D, G và các nhóm khác [69].
Cùng với sự phát triển của phương pháp PCR và phương pháp xác định trình tự DNA tự động, việc phân tích DNA ty thể hiện nay khơng cịn dựa nhiều vào kỹ thuật RFLP nữa mà chủ yếu dựa trên các trình tự của DNA ty thể, đặc biệt là vùng điều khiển D-loop. Việc nghiên cứu hệ gen ty thể, đọc trình tự nucleotide của các vùng siêu biến của đoạn D-loop cũng như các gen chức năng khác của ty thể, dẫn đến giải mã toàn bộ hệ gen ty thể của nhiều đại diện dân tộc khác nhau sẽ cung cấp số liệu để phân loại các nhóm đơn bội chính xác và chi tiết hơn [70]. Ngoài ra, đặc điểm di truyền ty thể người cũng tỏ ra hữu ích cho các nghiên cứu pháp y và nhận dạng con người [71].
* Vùng điều khiển (D-loop) ở DNA ty thể - Cấu trúc vùng D-loop
Ở động vật có vú, vùng điều khiển của DNA ty thể, hay còn gọi là vùng D-loop, là vùng điều hịa chính và là vùng duy nhất trong hệ gen ty thể khơng mã hóa protein. Vùng này chứa các điểm khởi đầu sao chép của chuỗi nặng và chuỗi nhẹ và chứa promoter cho sự phiên mã chuỗi nặng và chuỗi nhẹ.
Ở người, vùng D-loop có chiều dài khoảng 1,1 kb, nằm từ vị trí 16024 - 16569/0 - 576 và giữa hai gen tRNA vận chuyển cho acid amin Phenylalanin và Prolin. Do khơng mang các gen mã hóa protein nên các đột biến trung tính xảy ra nhiều và có thể nói là cao nhất so với tồn bộ hệ gen ty thể, cao hơn các vùng khác từ 1,8 lần đến 4,4 lần [72] [73], [74].
Năm 1983, Greenberg B.D. và cộng sự [75] đã xác định được hai đoạn DNA trong vùng D-loop có tần số đột biến cao nhất được gọi là vùng siêu biến 1 (HV1 - Hypervariable region) (có kích thước 359 bp, nằm ở vị trí
16024 - 16365) và vùng siêu biến 2 (HV2) (có kích thước 325 bp, nằm ở vị trí 57 - 372). Theo Vanecek T. và cộng sự [76] cịn có một trình tự và một vùng siêu biến HV3 với các trình tự lặp lại 2 nucleotide CA. Cấu trúc của vùng điều khiển D-loop được thể hiện ở hình 1.3.