Trình tự các đoạn gen mang các đa hình sau khi được xác định trên máy giải trình tự tự động ABI 3500 Genetic Analyzer (Applied Biosystems) được xử lý và so
sánh với trình tự chuẩn rCRS (Revised Cambridge Reference Sequence of the Human Mitochondrial ADN), Genbank ID NC_012920.1 (Andrews et al., 1999)
bằng phần mềm BioEdit. Sau đó, kiểm định Fisher exact test (2 phía) được sử dụng để so sánh tỷ lệ tần suất đa hình giữa 2 dân tộc khác nhau. Mức ý nghĩa được lấy với α=0,05. Ngoài ra, Haplogrep2 và PhyloTree Build 17 cũng được sử dụng để xác định các nhóm đơn bội của 5 dân tộc nghiên cứu.
Chương 3. KẾT QUẢ VÀ THẢO LUẬN 3.1. Tách chiết và tinh sạch ADN tổng số từ các mẫu máu
Tách chiết ADN tổng số từ máu toàn phần là một trong những bước quan trọng khi tiến hành các kỹ thuật sinh học phân tử. Độ tinh sạch và hàm lượng ADN tách chiết được sẽ ảnh hưởng trực tiếp đến sự thành công của nghiên cứu. Trong thí nghiệm này, 182 mẫu máu được thu thập từ 5 dân tộc Kinh, Thái, Hmong, Lolo và Giarai đã được sử dụng để tách chiết ADN tổng số bằng bộ kit GeneJET Genomic DNA Purification – Thermo theo hướng dẫn của nhà sản xuất. Các mẫu ADN sau khi được tách chiết được kiểm tra bằng cách điện di trên agarose 0,8%.
Hình 4. Ảnh điện di ADN tổng số trên gel agarose 0,8%
(Các giếng 1-10 tương ứng với sản phẩm tinh sạch của 10 mẫu ADN tổng số Kinh01, Kinh02, Thai251, Thai252, Hmong204, Hmong205, Lolo460, Lolo461,
Giarai718 và Giarai719)
Kết quả tách ADN được thể hiện đại diện trong hình 3 với 10 mẫu ADN đại diện của các dân tộc Kinh, Thái, Hmong, Lolo và Giarai cho thấy ở tất cả các băng đều xuất hiện một băng sáng rõ nét và vệt sáng kéo dài ở phía dưới mờ chứng tỏ ADN ít bị đứt gãy. Các mẫu khác cũng cho các băng tương tự, vì vậy ADN tổng số thu được đủ tiêu chuẩn để dùng cho các thí nghiệm tiếp theo.
3.2. Khuếch đại đoạn gen chứa trình tự gen HV-I và HV-II
ADN tổng số sau khi được tách chiết và tinh sạch được sử dụng làm khuôn để tổng hợp hai đoạn HV-I và HV-II với kích thước tương ứng là 543bp và 429bp
bằng phương pháp PCR sử dụng các cặp mồi đặc hiệu. 3µl sản phẩm PCR được điện di kiểm tra trên gel agarose 1% (Hình 4 và Hình 5).
Hình 5. Ảnh điện di sản phẩm PCR khuếch đại đoạn gen HV-I của một số mẫu đại diện trên gel agarose 1%
M: ADN ladder 1kb (Thermo), 1-15: Sản phẩm PCR khuếch đại đoạn gen HV-I tương ứng với các mẫu Kinh01, Kinh02, Kinh03, Thai251, Thai252, Thai253,
Hmong204, Hmong205, Hmong206, Lolo460, Lolo461, Lolo462, Giarai718, Giarai719 và Giarai720, N: Đối chứng âm (không có ADN khuôn)
Hình 6. Ảnh điện di sản phẩm PCR khuếch đại đoạn gen HV-II của một số mẫu đại diện trên gel agarose 1%
M: ADN ladder 1kb (Thermo), 1-15: Sản phẩm PCR khuếch đại đoạn gen HV-II tương ứng với các mẫu Kinh01, Kinh02, Kinh03, Thai251, Thai252, Thai253,
Hmong204, Hmong205, Hmong206, Lolo460, Lolo461, Lolo462, Giarai718, Giarai719 và Giarai720, N: Đối chứng âm (không có ADN khuôn)
Kết quả điện di một số mẫu đại diện (Kinh01, Kinh02, Kinh03, Thai251, Thai252, Thai253, Hmong204, Hmong205, Hmong206, Lolo460, Lolo461, Lolo462, Giarai718, Giarai719 và Giarai720) cho thấy sản phẩm PCR của hai đoạn HV- I và HV-II là các băng sắc nét đặc hiệu có kích thước phù hợp với kích thước
tính toán lý thuyết. Sản phẩm PCR được tinh sạch và giữ trong tủ -20oC để cho giải trình tự trực tiếp từ sản phẩm PCR.
3.3. Xác định trình tự và phân tích số liệu các đoạn gen HV-I và HV-II của các mẫu nghiên cứu
3.3.1. Xác định các đa hình thuộc hai vùng siêu biến HV-I và HV-II của các mẫu nghiên cứu mẫu nghiên cứu
Sản phẩm PCR sau khi được tinh sạch được tiếp tục xác định trình tự nucleltide bằng máy ABI 3500 Genetic Analyzer (Applied Biosystems) sử dụng BigDye Terminator v3.1 Cycle Sequencing Kit. Sau đó, trình tự hai đoạn HV-I và HV-II của các mẫu nghiên cứu được so sánh với trình tự rCRS trên GenBank (NC_12920.1) nhằm xác định sự xuất hiện của các đa hình (Hình 7). Kết quả so sánh các trình tự thu được với trình tự chuẩn của vùng HV-I và HV-II trên cơ sở dữ liệu rCRS thu được các đa hình chi tiết ở Phụ lục 1.
Kết quả cho thấy có tổng cộng có 302 điểm sai khác so với trình tự tham chiếu rCRS, trong đó có 197 điểm sai khác trên HV-I và 105 điểm sai khác trên HV-II. Bên cạnh đó, kết quả cũng chỉ ra 139 điểm đa hình khác nhau trong 182 mẫu nghiên cứu (Phụ lục 1). Tổng số các đa hình đã được xác định ở mỗi dân tộc nghiên cứu có sự chênh lệch đáng kể. Dân tộc Kinh chứa số lượng các điểm đa hình được tìm thấy cao nhất với 96 đa hình bao gồm 60 đa hình thuộc HV-I và 36 đa hình thuộc HV-II. Dân tộc Thái chứa 62 đa hình bao gồm 42 đa hình thuộc HV-I và 20 đa hình thuộc HV-II. Hai dân tộc Hmong và Giarai đều chứa 52 đa hình bao gồm 34 đa hình thuộc HV-I và 18 đa hình thuộc HV-II. Số lượng các điểm đa hình được tìm thấy ít nhất ở dân tộc Lolo với 30 đa hình, trong đó 27 đa hình thuộc HV-I và 13 đa hình thuộc HV-II (Hình 8). Ở cả năm dân tộc, các đa hình tập trung chủ yếu ở HV-I, điều này phản ánh tốc độ đột biến cao hơn ở khu vực này so với HV-II.
Hình 7. Kết quả giải trình tự một số mẫu đại diện chứa một số đa hình trên đoạn HV-I
trong đó: A, B, C, D, E: Các đoạn trình tự của đoạn HV-I giống với trình tự tham chiếu rCRS của các cá thể tương ứng Kinh15, Thái271, Hmong210, Lolo486 và Giarai734. A’, B’, C’, D’, E’: Các đoạn trình tự của đoạn HV-I khác với trình tự tham chiếu rCRS của các cá thể tương ứng Kinh12, Thái272, Hmong211, Lolo487
và Giarai735. A16162G G16129A A A’ B B’ C C’ D D’ ’ E E’ A16182C T16086C T16217C
Hình 8. Biểu đồ thống kê đa hình trên 2 đoạn HV-I và HV-II của vùng D-loop phát hiện được ở các dân tộc Kinh, Thái, Hmong, Lolo và Giarai khi so sánh với trình tự
tham chiếu rCRS
Trong tất cả các đa hình thu được, 38 đa hình chỉ xuất hiện ở dân tộc Kinh (G203A, T131C, T146A, A153G, G185A, A189G, T266C, A234G, A249G, G255A, T279C, A384G, C456T, C463T, A479G, G499A, T507C, A523G, A574C, T16075C, T16092C, T16136C, C16147T, C16148T, T16157C, A16166G, C16174T, A16175G, C16218T, T16243C, T16263C, A16269G, G16273A, A16293T, C16294T, C16296T, A16305G, A16482G), 9 đa hình chỉ xuất hiện ở dân tộc Thái (C182T, A244G, C298T, C466T, C16143T, C16150T, C16168T, C16214T, C16465T), 6 đa hình chỉ xuất hiện ở dân tộc Hmong (T63C, G66A, T16224C, C16262T, T16357C, T16381C), 4 đa hình chỉ xuất hiện ở dân tộc Lolo (A224G, A374G, G16213A, A16289G) và 9 đa hình chỉ xuất hiện ở dân tộc Giarai (G225A, G316A, C332T, C16193T, A16206G, A16240G, A16272G, A16284G, A16309G). Có 4 đa hình xuất hiện với tần suất cao chiếm từ 63% đến 100% ở cả 5 dân tộc (A73G, A263G, T310C và T16519C), trong đó 2 đa hình A73G và A263G xuất hiện với tần suất 100%. Các đa hình này cũng xuất hiện ở một số nghiên cứu khác chẳng hạn như nghiên cứu của Huỳnh Thị Thu Huệ và cộng sự [3], Nguyễn Đăng Tôn và cộng sự [5], Trần Thị Thúy Hằng và cộng sự [7].
60 42 34 27 34 36 20 18 13 18 0 10 20 30 40 50 60 70 Kinh (N=51) Thái (N=24) Hmong (N=41) Lolo (N=36) Giarai (N=30) HV - I HV - I I
3.3.2. Phân tích thống kê các đa hình thuộc hai vùng siêu biến HV-I và HV-II ở các dân tộc Kinh, Thái, Hmong, Lolo và Giarai các dân tộc Kinh, Thái, Hmong, Lolo và Giarai
Sau khi được xác định, các đa hình phổ biến trên hai vùng siêu biến HV-I và HV-II (tần suất 10%) xuất hiện ở 1 trong 5 dân tộc được lựa chọn để thực hiện các phân tích thống kê sử dụng Fisher Exact test. Các dân tộc Kinh, Thái, Hmong, Lolo và Giarai được so sánh với nhau từng đôi một.
❖ Phân tích thống kê so sánh đa hình giữa hai dân tộc Kinh và Thái
Các đa hình phổ biến của dân tộc Thái và Kinh sau khi được phân tích thống kê sử dụng kiểm định Fisher exact test cho thấy có 02 đa hình có tần suất khác nhau có ý nghĩa thống kê là A16183C và T16189C (Bảng 2).
Bảng 2. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Kinh và Thái
STT Vùng gen Đa hình Dân tộc Kinh (Số cá thể = 51)
Dân tộc Thái
(Số cá thể = 24) p-value(*)
1 HV-I A16183C 24 (47%) 5 (21%) 0,02542
2 HV-I T16189C 29 (57%) 5 (21%) 0,00319
(*) p-value được tính bằng kiểm định Fisher exact 2 phía (p < 0,05 có ý nghĩa thống kê)
❖ Phân tích thống kê so sánh đa hình giữa hai dân tộc Kinh và Hmong
Các đa hình phổ biến của dân tộc Hmong và Kinh sau khi được phân tích thống kê sử dụng kiểm định Fisher exact test cho thấy có 12 đa hình có tần suất khác nhau có ý nghĩa thống kê (Bảng 3). Trong đó, có 4 đa hình chỉ phát hiện ở nhóm người Kinh mà không thấy xuất hiện ở nhóm người Hmong (T146C, T152C, T199C và T16297C) và có 6 đa hình chỉ phát hiện ở nhóm người Hmong mà không thấy xuất hiện ở người Kinh (C64T, T16086C, C16257T, A16262G, T16288C và T16357C) (Bảng 3).
Bảng 3. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Kinh và Hmong
(*) p-value được tính bằng kiểm định Fisher exact 2 phía (p < 0,05 có ý nghĩa
thống kê)
❖ Phân tích thống kê so sánh đa hình giữa hai dân tộc Kinh và Giarai
Các đa hình phổ biến của dân tộc Giarai và Kinh sau khi được phân tích thống kê sử dụng kiểm định Fisher exact test cho thấy có 14 đa hình có tần suất khác nhau có ý nghĩa thống kê (Bảng 4). Trong đó, có 1 đa hình chỉ phát hiện ở nhóm người Kinh mà không thấy xuất hiện ở nhóm người Giarai (T16093C) và có 6 đa hình chỉ phát hiện ở nhóm người Giarai mà không thấy xuất hiện ở người Kinh (G225A, G316A, C16193T, C16256T, và A16272G) hoặc xuất hiện ít với 1 cá thể đơn lẻ (G143A) (Bảng 4).
STT Vùng gen Đa hình Dân tộc Kinh (Số cá thể = 51) Dân tộc Hmong (Số cá thể = 41) p-value(*) 1 HV-II C64T 0 (0%) 10 (49%) 0,00015 2 HV-II T146C 5 (10%) 0 (0%) 0,04776 3 HV-II T152C 5 (10%) 0 (0%) 0,04776 4 HV-II T199C 10 (20%) 0 (0%) 0,00177 5 HV-I T16086C 0 (0%) 7 (17%) 0,00256 6 HV-I G16129A 15 (29%) 4 (10%) 0,0180 7 HV-I C16257T 0 (0%) 8 (20%) 0,00102 8 HV-I C16261T 5 (10%) 13 (32%) 0,00879 9 HV-I A16262G 0 (0%) 8 (20%) 0,00102 10 HV-I T16288C 0 (0%) 5 (12%) 0,01523 11 HV-I T16297C 6 (12%) 0 (0%) 0,02525 12 HV-I T16357C 0 (0%) 6 (15%) 0,00631
Bảng 4. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Kinh và Giarai
STT Vùng gen Đa hình Dân tộc Kinh (Số cá thể = 51) Dân tộc Giarai (Số cá thể = 30) p-value(*) 1 HV-II G143A 1 (2%) 5 (17%) 0,02422 2 HV-II C151T 2 (4%) 10 (33%) 0,00058 3 HV-II G225A 0 (0%) 4 (13%) 0,01647 4 HV-II T310C 40 (78%) 29 (97%) 0,02244 5 HV-II G316A 0 (0%) 4 (13%) 0,01647 6 HV-II T489C 23 (45%) 23 (77%) 0,00502 7 HV-I T16093C 7 (14%) 0 (0%) 0,03329 8 HV-I C16193T 0 (0%) 3 (10%) 0,04758 9 HV-I C16223T 20 (39%) 26 (87%) 0,00002 10 HV-I C16256T 0 (0%) 3 (10%) 0,04758 11 HV-I T16271C 2 (4%) 10 (33%) 0,00058 12 HV-I A16272G 0 (0%) 4 (13%) 0,01647 13 HV-I T16311C 7 (14%) 12 (40%) 0,00829 14 HV-I T16519C 38 (75%) 28 (93%) 0,0305
(*) p-value được tính bằng kiểm định Fisher exact 2 phía (p < 0,05 có ý nghĩa
thống kê)
❖ Phân tích thống kê so sánh đa hình giữa hai dân tộc Kinh và Lolo
Các đa hình phổ biến của dân tộc Lolo và Kinh sau khi được phân tích thống kê sử dụng kiểm định Fisher exact test cho thấy có 20 đa hình có tần suất khác nhau có ý nghĩa thống kê (Bảng 5). Trong đó, có 5 đa hình chỉ phát hiện ở nhóm người Kinh mà không thấy xuất hiện ở nhóm người Lolo (C16223T, T16297C và T16311C) hoặc xuất hiện ít với 1 cá thể đơn lẻ (T199C và T489C). Ngược lại, có 10 đa hình chỉ phát hiện ở nhóm người Lolo mà không thấy xuất hiện ở người Kinh
(A183G, A244G, A374G, A16180C, A16181C, C16232A, A16289G và C16292T) hoặc xuất hiện ít với 1 cá thể đơn lẻ (G16274A và C16301G) (Bảng 5).
Bảng 5. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Kinh và Lolo
(*) p-value được tính bằng kiểm định Fisher exact 2 phía (p < 0,05 có ý nghĩa thống kê)
STT Vùng gen Đa hình Dân tộc Kinh (Số cá thể = 51) Dân tộc LoLo (Số cá thể = 36) p-value(*) 1 HV-II T152C 5 (10%) 13 (36%) 0,00338 2 HV-II A183G 0 (0%) 8 (22%) 0,00052 3 HV-II T199C 10 (20%) 1 (3%) 0,01813 4 HV-II A244G 0 (0%) 7 (19%) 0,00143 5 HV-II A374G 0 (0%) 8 (22%) 0,00052 6 HV-II T489C 23 (45%) 1 (3%) 0,000004 7 HV-I A16180C 0 (0%) 5 (14%) 0,01020 8 HV-I A16181C 0 (0%) 5 (14%) 0,01020 9 HV-I A16182C 9 (18%) 19 (53%) 0,00063 10 HV-I A16183C 24 (47%) 26 (72%) 0,01643 11 HV-I T16217C 6 (12%) 19 (53%) 0,00004 12 HV-I C16223T 20 (39%) 0 (0%) 0,000003 13 HV-I C16232A 0 (0%) 4 (11%) 0,02526 14 HV-I G16274A 1 (2%) 8 (22%) 0,00319 15 HV-I A16289G 0 (0%) 8 (22%) 0,00052 16 HV-I C16292T 0 (0%) 5 (14%) 0,01020 17 HV-I T16297C 6 (12%) 0 (0%) 0,035 18 HV-I C16301G 1 (2%) 8 (22%) 0,00319 19 HV-I T16311C 7 (14%) 0 (0%) 0,01981 20 HV-I T16519C 38 (75%) 35 (97%) 0,00340
❖ Phân tích thống kê so sánh đa hình giữa hai dân tộc Thái và Hmong
Các đa hình phổ biến của dân tộc Thái và Hmong sau khi được phân tích thống kê sử dụng kiểm định Fisher exact test cho thấy có 13 đa hình có tần suất khác nhau có ý nghĩa thống kê (Bảng 6). Trong đó, có 3 đa hình chỉ phát hiện ở nhóm người Thái mà không thấy xuất hiện ở nhóm người Hmong (T146C, T152C và T199C). Ngược lại, có 5 đa hình chỉ phát hiện ở nhóm người Hmong mà không thấy xuất hiện ở người Thái (A210G, T16086C, C16262T, T16288C và A16300G).
Bảng 6. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Thái và Hmong
STT Vùng gen Đa hình Dân tộc Thái (Số cá thể = 24) Dân tộc Hmong (Số cá thể = 41) p-value(*) 1 HV-II C64T 1 (4%) 10 (49%) 0,033 2 HV-II T146C 6 (25%) 0 (0%) 0,0016 3 HV-II T152C 5 (20%) 0 (0%) 0,0051 4 HV-II T199C 4 (17%) 0 (0%) 0,015 5 HV-II A210G 0 (0%) 10 (24%) 0,0063 6 HV-II T489C 13 (54%) 11 (27%) 0,026 7 HV-I T16086C 0 (0%) 7 (17%) 0,032 8 HV-I G16129A 9 (37,5%) 4 (10%) 0,0095 9 HV-I T16140C 1 (4%) 10 (24%) 0,033 10 HV-I C16257C 1 (4%) 8 (20%) 0,083 11 HV-I C16262T 0 (0%) 8 (20%) 0,019 12 HV-I T16288C 0 (0%) 5 (12%) 0,09 13 HV-I A16300G 0 (0%) 5 (12%) 0,09
(*) p-value được tính bằng kiểm định Fisher exact 2 phía (p < 0,05 có ý nghĩa thống kê)
❖ Phân tích thống kê so sánh đa hình giữa hai dân tộc Thái và Lolo
Các đa hình phổ biến của dân tộc Thái và Lolo sau khi được phân tích thống kê sử dụng kiểm định Fisher exact test cho thấy có 11 đa hình có tần suất khác nhau có ý nghĩa thống kê (Bảng 7). Trong đó, có 2 đa hình chỉ phát hiện ở nhóm người Thái mà không thấy xuất hiện ở nhóm người Lolo (C16223T và T16311C). Ngược lại, có 4 đa hình chỉ phát hiện ở nhóm người Lolo mà không thấy xuất hiện ở người Thái (A183G, A374G, A16289G và T16311C).
Bảng 7. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Thái và Lolo
STT Vùng gen Đa hình Dân tộc Thái (Số cá thể = 24) Dân tộc Lolo (Số cá thể = 36) p-value(*) 1 HV-II A183G 0 (0%) 8 (22%) 0,012 2 HV-II A374G 0 (0%) 8 (22%) 0,012 3 HV-II T489C 13 (54%) 1 (3%) 0,000005 4 HV-I A16182C 4 (17%) 19 (53%) 0,0046 5 HV-I A16183C 5 (21%) 26 (72%) 0,0001 6 HV-I T16189C 5 (21%) 26 (72%) 0,0001 7 HV-I T16217C 4 (17%) 19 (53%) 0,0046 8 HV-I C16223T 11 (46%) 0 (0%) 0,000007 9 HV-I A16289G 0 (0%) 8 (22%) 0,0118 10 HV-I C16301G 0 (0%) 8 (22%) 0,0118 11 HV-I T16311C 7 (29%) 0 (0%) 0,00089
(*) p-value được tính bằng kiểm định Fisher exact 2 phía (p < 0,05 có ý nghĩa thống kê)
❖ Phân tích thống kê so sánh đa hình giữa hai dân tộc Thái và Giarai
Các đa hình phổ biến của dân tộc Thái và Giarai sau khi được phân tích thống kê sử dụng kiểm định Fisher exact test cho thấy có 6 đa hình có tần suất khác
nhau có ý nghĩa thống kê (Bảng 8). Trong đó, chỉ có 1 đa hình chỉ phát hiện ở nhóm người Thái mà không thấy xuất hiện ở nhóm người Giarai (T16217C). Ngược lại, có 2 đa hình chỉ phát hiện ở nhóm người Lolo mà không thấy xuất hiện ở người Thái (C151T và T16271C).
Bảng 8. Các đa hình phổ biến có tần suất khác nhau giữa dân tộc Thái và Giarai
STT Vùng gen Đa hình Dân tộc Thái (Số cá thể = 24) Dân tộc Giarai (Số cá thể = 30) p-value(*) 1 HV-II C151T 0 (0%) 10 (33%) 0,00125 2 HV-II T310C 17 29 (97%) 0,011 3 HV-I T16189C 5 (21%) 14 (47%) 0,044 4 HV-I T16217C 4 0 (0%) 0,0335 5 HV-I C16223T 11 26 (87%) 0,0016 6 HV-I T16271C 0 (0%) 10 (33%) 0,00125
(*) p-value được tính bằng kiểm định Fisher exact 2 phía (p < 0,05 có ý nghĩa thống kê)
❖ Phân tích thống kê so sánh đa hình giữa hai dân tộc Hmong và Lolo