CHƢƠNG 2 NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU
2.1. Nội dung nghiên cứu
Với mục tiêu khảo sát sự đa dạng di truyền của quần thể chó lưng xốy Phú Quốc dựa trên đoạn trình tự 582 cặp base vùng CR (HV1) DNA ty thể, từ đó xác định mối quan hệ di truyền và nguồn gốc của chó lưng xoáy Phú Quốc, nội dung nghiên cứu của đề tài được chia thành 4 nội dung chính:
- Nội dung 1: Xây dựng cơ sở dữ liệu và công cụ định loại haplotype đoạn 582 cặp
base vùng HV1 DNA ty thể chó.
Nội dung này được tiến hành nhằm xây dựng cơ sở dữ liệu đoạn trình tự 582 cặp base vùng HV1 của DNA ty thể chó. Dữ liệu sẽ được kiểm tra tính chính xác và sẽ được hiệu chỉnh nếu có sự sai lệch, không thống nhất. Bộ dữ liệu chuẩn về các haplotype của chó trên tồn thế giới sẽ được sử dụng để xây dựng công cụ định loại haplotype, hỗ trợ định loại nhanh haplotype của các mẫu chó lưng xốy Phú Quốc và chó nhà Việt Nam ở phần nghiên cứu tiếp theo.
- Nội dung 2: Xác định trình tự nucleotide đoạn 582 cặp base vùng HV1 DNA ty
thể của chó nhà Việt Nam và chó lưng xốy Phú Quốc
Trình tự nucleotide của đoạn 582 cặp base vùng HV1 DNA ty thể của các mẫu chó nhà Việt Nam và chó lưng xốy Phú Quốc được thu thập và xác định, là nguồn dữ liệu để phân tích, đánh giá mức độ đa dạng di truyền của hai quần thể chó.
- Nội dung 3: Đánh giá sự đa dạng di truyền của chó lưng xốy Phú Quốc dựa trên
đoạn 582 cặp base vùng HV1 DNA ty thể.
Sự đa dạng di truyền của quần thể chó lưng xốy Phú Quốc và chó nhà Việt Nam được khảo sát dựa trên sự xuất hiện và tần số xuất hiện tương ứng của các haplotype trong quần thể. Thông tin về sự đa dạng di truyền sẽ thể hiện mối quan hệ di truyền giữa chó lưng xốy Phú Quốc với các giống chó khác trên thế giới, làm cơ sở cho việc nhận định nguồn gốc của giống chó này.
- Nội dung 4: Nhận định nguồn gốc của chó lưng xốy Phú Quốc.
Nguồn gốc của chó lưng xốy Phú Quốc sẽ được nhận định dựa trên thông tin đã được công bố trên thế giới về nguồn gốc của chó nhà nói chung, thơng tin về sự đa dạng di truyền của chó lưng xốy Phú Quốc cũng như thông tin về mối quan hệ di truyền của chó nhà Việt Nam, chó lưng xốy Phú Quốc được rút ra từ đề tài.
Sự liên hệ giữa các nội dung được thể hiện trong sơ đồ tóm tắt tồn bộ quy trình làm việc bên dưới (Hình 2.1).
Hình 2.1: Quy trình thực hiện các nội dung nghiên cứu
2.2. Phƣơng pháp nghiên cứu
2.2.1. Xây dựng cơ sở dữ liệu và công cụ định loại haplotype đoạn 582 cặp base vùng HV1 DNA ty thể vùng HV1 DNA ty thể
2.2.1.1. Xây dựng cơ sở dữ liệu các trình tự đoạn 582 cặp base vùng HV1DNA ty thể thể
Cơ sở dữ liệu được thiết kế theo mơ hình quan hệ bao gồm 6 bảng có mối quan hệ ràng buộc với nhau (Hình 2.2). Trong số 6 bảng này, 2 bảng chứa thơng tin về phân lồi và giống của các cá thể thuộc lồi Canis lupus, 4 bảng cịn lại chứa các thông tin cơ bản về trình tự được tách từ trang thông tin của GenBank (bảng gbinfos, bảng sequences) cũng như các thơng tin đã được phân tích xử lý như vị trí các vùng HV1, HV2, vùng 582 cặp base (bảng seq_annotations), và haplotype tương ứng của trình tự (bảng haplotypes). Cơ sở dữ liệu này được quản lý bởi trình quản trị cơ sở dữ liệu MySQL.
Hình 2.2: Mơ hình dữ liệu
Đoạn trình tự tham khảo dài 582 cặp base của DNA ty thể chó nhà (có mã số GenBank là U96639.2) được chọn là trình tự chuẩn [37]. Trình tự này được đưa vào cơng cụ BLAST [8] để tìm tất cả các trình tự tương đồng được lưu trữ trong cơ sở dữ liệu nucleotide GenBank. Với thông số E-value của công cụ BLAST là 10e-94,
hầu hết các trình tự thu thập được từ kết quả BLAST đều là những trình tự DNA ty thể tương tự như trình tự chuẩn và đều thuộc các cá thể thuộc lồi Canis lupus. Với mỗi trình tự thu được, mã số truy cập của trình tự (accession number) ở GenBank được sử dụng để tải về tồn bộ thơng tin của trình tự đó được lưu trữ trong cơ sở dữ liệu GenBank như trình tự nucleotide, tên của sinh vật có trình tự đó, chú giải trình tự…v..v… Do vẫn cịn một số trình tự DNA ty thể của các cá thể thuộc chi, loài khác như Lycalopex, Cerdocyon…trong kết quả BLAST, một bộ lọc thứ hai được
thiết lập để chỉ những trình tự nào thuộc về các loài trong loài Canis lupus mới
được ghi nhận, tách các thông tin và được lưu vào cơ sở dữ liệu. Ngồi các thơng tin có sẵn trên bản ghi từ GenBank như trên, cơ sở dữ liệu cịn lưu trữ thơng tin có được do phân tích trình tự. Thơng tin về haplotype, vị trí bắt đầu và vị trí kết thúc của vùng HV1, HV2, vùng 582 cặp base của mỗi trình tự DNA ty thể cũng được xác định và lưu vào cơ sở dữ liệu. Tồn bộ quy trình này được thực hiện với một chương trình máy tính tự tạo, được viết bằng ngơn ngữ lập trình Perl (Hình 2.3).
2.2.1.2. Đánh số nucleotide và trình bày các đột biến
Mỗi trình tự nucleotide được lưu trữ trong cơ sở dữ liệu sẽ được sắp gióng cột với trình tự chuẩn (mã số GenBank U96639.2) bằng phần mềm ClustalW [45]. Kết quả sắp gióng cột sẽ được hiệu chỉnh thủ cơng để xếp cho đúng vị trí của một vài nucleotide đột biến thêm vào hay mất đi (indel) theo đề xuất của Pereira và cộng sự [57]. Do trong GenBank, các trình tự được đệ trình có nhiều kích thước khác nhau, nên để thống nhất, các nucleotide trong mỗi trình tự sẽ được đánh số tương ứng với vị trí của nucleotide trong trình tự chuẩn [57], nghĩa là lấy vị trí tuyệt đối của nucleotide trên tồn bộ DNA ty thể, khơng phải vị trí tương đối của chúng trong trình tự. Các đột biến so với trình tự chuẩn được trình bày theo định dạng XaY, với X là nucleotide trên trình tự chuẩn ở vị trí a và Y là nucleotide tại vị trí tương ứng trên trình tự khảo sát. Vị trí nucleotide bị trống (trong trường hợp đột biến thêm hay mất nucleotide) được biểu thị bằng dấu “-“. Ví dụ, T15639G biểu thị nucleotide T ở vị trí 15639 đã bị biến đổi thành nucleotide G, -15535.1C -15535.2C biểu thị hai nucleotide C được thêm vào sau nucleotide ở vị trí 15535. Tất cả các đột biến xuất hiện trên vùng 582 cặp base của mỗi trình tự được gọi là bộ đột biến của trình tự, được dùng để xác định haplotype của trình tự đó.
2.2.1.3. Xác định haplotype và hiệu chỉnh dữ liệu
Các trình tự và các haplotype đã được cơng bố sẽ được thu thập để phân tích, xác định các bộ đột biến của mỗi haplotype. Các bộ đột biến này sẽ được dùng để làm cơ sở để xác định haplotype của các trình tự chưa biết haplotype. Ví dụ, haplotype A9 có bộ đột biến là “A15627G T15639A C15814T”, nghĩa là so với trình tự chuẩn thì trình tự có haplotype A9 mang 3 đột biến A thành G, T thành A và C thành T ở 3 vị trí tương ứng là 15627, 15639 và 15814.
Những thơng tin về haplotype của các trình tự DNA bị sai lệch hoặc không rõ ràng sẽ được phát hiện và điều chỉnh. Quá trình này sẽ được tiến hành với các luật sau:
1. Trình tự đầu tiên được dùng để cơng bố một haplotype sẽ được ghi nhận là trình tự chuẩn của haplotype đó.
2. Trình tự giống trình tự chuẩn của một haplotype đã công bố nhưng được dùng để công bố haplotype khác thì haplotype sau sẽ bị loại ra khỏi danh sách haplotype đã được cơng bố.
3. Trình tự khác với trình tự chuẩn của một haplotype đã công bố nhưng cơng bố tên giống với haplotype đó thì được xem là cơng bố sai, thơng tin cần phải được hiệu chỉnh.
Tồn bộ các trình tự có haplotype đã biết sẽ được sắp gióng cột để xác định các đột biến đặc trưng cho từng haplogroup A, B, C, D, E, F. Các trình tự có bộ đột biến mới, chưa xác định được haplotype, nếu mang những đột biến đặc trưng của haplogroup nào sẽ được ghi nhận là có haplotype mới thuộc haplogroup đó.
2.2.1.4. Cơng cụ xác định haplotype vùng HV1 của DNA ty thể
Công cụ xác định nhanh haplotype vùng HV1 của DNA ty thể ở chó được viết bằng ngơn ngữ lập trình Perl, với giao diện là một trang web, được đặt tên là “Haplotype identifier”. Bằng cách so sánh trình tự cần xác định haplotype (trình tự truy vấn) với trình tự chuẩn [37], Haplotype identifier nhận diện đoạn trình tự 582 cặp base cần phân tích. Nếu trình tự truy vấn khơng bao gồm hoặc chỉ là một phần của đoạn trình tự 582 cặp base, chương trình sẽ báo trình tự khơng thích hợp để xác định haplotype. Nếu trình tự truy vấn bao gồm tồn bộ đoạn trình tự 582 cặp base, chương trình sẽ xác định các đột biến của trình tự truy vấn so với trình tự chuẩn. Các thơng tin về đột biến này sẽ được kiểm tra với các haplotype đã được công bố để định loại haplotype nếu trùng khớp với một haplotype xác định đã biết. Nếu không trùng khớp với một haplotype đã biết, trình tự này được xác định là một haplotype mới. Tập hợp các đột biến của haplotype mới sẽ tiếp tục được so sánh với tập hợp các đột biến đặc trưng của từng haplogroup để xác định haplogroup của haplotype mới này (Hình 2.4).
Hình 2.4: Sơ đồ hoạt động của cơng cụ xác định haplotype "Haplotype identifier”
2.2.1.5. Xây dựng cây phát sinh chủng loại
Cây phát sinh chủng loại được thiết lập bằng chương trình Paup* [82], sử dụng phương pháp Neighbor-Joining với 2000 lần lặp lại để xác định độ tin cậy của các nhánh cây. Ngồi các trình tự DNA cần khảo sát, việc thiết lập cây cịn bao gồm trình tự của 319 haplotype thuộc 6 haplogroup A, B, C, D, E, F đã được công bố trước đây. Các trình tự có mã số GenBank NC_008093, KF661096, DQ480509 – DQ480511, EU789789 của Canis latrans được sử dụng làm nhóm ngoại (outgroup) để xác định gốc cây. Hình ảnh cây được thể hiện bởi phần mềm TreeExplorer của phần mềm MEGA6 [84].
2.2.2. Xác định trình tự nucleotide đoạn 582 cặp base vùng HV1 DNA ty thể của chó nhà Việt Nam và chó lưng xốy Phú Quốc chó nhà Việt Nam và chó lưng xốy Phú Quốc
2.2.2.1. Dụng cụ và thiết bị sử dụng
Các dụng cụ (Phụ lục 2) và thiết bị (Phụ lục 3) cơ bản được trang bị ở Phịng thí nghiệm Sinh học phân tử (Đại học Sài gòn), Viện bảo tồn gene (Đại học Nguyễn Tất Thành) như máy ly tâm, máy PCR… đã đáp ứng được hầu hết các nội dung cần thực hiện của đề tài. Phân tích dữ liệu và xây dựng công cụ định loại haplotype được thực hiện trên máy tính cá nhân.
2.2.2.2. Thu thập và xử lý mẫu
Đề tài sử dụng hai nhóm chó để khảo sát: chó lưng xốy Phú Quốc và chó nhà Việt Nam. Cụm từ “Chó nhà Việt Nam” sử dụng trong đề tài để chỉ nhóm chó nhà (chó cỏ) Việt nam khơng có các đặc điểm hình thái giống các giống chó ngoại nhập thơng thường như chó đốm, chó Shepherd của Đức,… và khơng bao gồm chó lưng xốy Phú Quốc. Các tiêu chí để nhận diện chó lưng xốy Phú Quốc sử dụng trong đề tài bao gồm:
(1) Có xốy lưng. Đây là đặc điểm khơng độc quyền của chó lưng xốy Phú Quốc (chó lưng xốy Thái Lan cũng có đặc điểm này) cũng như khơng phải tất cả các chó lưng xốy Phú Quốc đều có lưng xốy. Việc sử dụng đặc điểm có xốy lưng nhằm giảm thiểu việc thu mẫu nhầm với các giống chó khơng có lưng xốy khác.
(2) Có nguồn gốc từ đảo Phú Quốc (chó hoặc chó cha mẹ đang sống trên đảo hoặc được mang đi nơi khác từ đảo)
(3) Chó trưởng thành (hơn 1 tuổi), trơng khỏe mạnh, có thể trọng khoảng 15 kg, chiều cao khoảng từ 45 – 55 cm. Chiều cao, cân nặng của chó khơng phải là đặc điểm tiên quyết để phân biệt với chó lưng xốy Thái Lan. Tuy nhiên, việc kết hợp đặc điểm này với các đặc điểm (1), (2) cũng giúp giảm thiểu việc thu mẫu nhầm với chó lưng xốy Thái Lan.
(4) Đầu chó nhỏ, sọ dài, tai nhỏ và đứng. Đi chó cong vút cần câu tạo thành ẵ n ắ vũng trũn, õy l c im dễ thấy ở chó lưng xốy Phú Quốc, đã được ghi nhận bởi Nguyễn Hữu Chiếm và cộng sự, Đại học Cần Thơ.
(5) Các đặc điểm về đốm lưỡi, màng bơi, móng đeo nếu có thì sẽ góp phần khẳng định chó lưng xốy Phú Quốc, nhưng khơng được xem là đặc điểm phải có.
Để dễ dàng trong việc đề cập và so sánh với các giống chó khác, đề tài xem hai nhóm chó khảo sát là hai giống chó riêng biệt, dù hai giống chó này chưa được FCI công nhận là “giống” về mặt phân loại học.
Các nghiên cứu tương tự trên thế giới đối với các giống chó khác nhau thường được thực hiện với số lượng mẫu là 30 con chó hoặc nhiều hơn để có ý nghĩa thống
kê. Căn cứ trên tình hình nghiên cứu chung trên thế giới và nguồn lực của đề tài, 200 mẫu lơng chó bao gồm 100 con chó lưng xốy Phú Quốc và 100 con chó nhà Việt Nam trong nghiên cứu này được thu thập từ đảo Phú Quốc, thành phố Rạch Giá (Kiên Giang), Thành phố Hồ Chí Minh và các vùng phụ cận (Lâm Đồng, Bình Dương) (Hình 2.5; chi tiết ở Phụ lục 4, Phụ lục 5). Những mẫu chó nhà Việt Nam được chọn ở vùng ngoại ô hoặc trong rẫy cách xa khu vực trung tâm để giảm thiểu khả năng lai tạp từ các giống chó ngoại quốc. Những mẫu chó có mối quan hệ gần gũi theo dòng mẹ sẽ bị loại trừ.
Hình 2.5: Vị trí thu mẫu và số lượng mẫu thu được
Các vùng thu mẫu được tô màu đỏ. Tên của tỉnh/thành phố được thể hiện gần vùng tơ đỏ, các con số phía dưới tên tỉnh/thành phố thể hiện lần lượt số lượng mẫu chó
Để an tồn cho người thu mẫu, và dựa trên sự đồng ý của chủ ni chó, lơng đi chó được lựa chọn để thu thập mẫu. Sử dụng kẹp đã rửa sạch bằng cồn 96º để nhổ lấy cả phần gốc của sợi lông. Số lượng sợi lơng thu cho mỗi mẫu ít nhất là 80 sợi, đủ cho hai lần tách chiết DNA. Ở thực địa, lơng chó được trữ trong các túi ny- lơng riêng biệt có khóa kéo và đưa về phịng thí nghiệm. Sau đó, lơng chó được cắt ngắn khoảng 1 cm tính từ gốc, rửa bằng nước cất vô trùng, cho vào eppendorf 1,5 ml và giữ mẫu ở nhiệt độ -30ºC cho đến khi sử dụng.
2.2.2.3. Tách chiết DNA tổng số từ lơng chó
DNA được tách chiết bằng phương pháp sử dụng Phenol:Chloroform [39], [69], phù hợp với điều kiện phịng thí nghiệm sinh học phân tử thơng thường. Quy trình tách chiết được xây dựng bao gồm hai bước ủ với dung dịch ly giải nhằm nâng cao hiệu quả phá vỡ màng tế bào, màng nhân. Đầu tiên, màng tế bào sẽ được phá vỡ bằng các chất tẩy SDS, Triton X100 có trong dung dịch ly giải. Sau khoảng chừng 20 phút, proteinase K được thêm vào nhằm phân hủy các protein nội bào. Các điều kiện của quá trình tách chiết DNA cần được khảo sát bao gồm thời gian ủ mẫu, nhiệt độ ủ mẫu, và muối dùng trong tủa DNA.
Theo các nghiên cứu trước đây, nhiệt độ ủ mẫu với proteinase K thường là 50oC [80], 56oC [15], [58], hay 65oC [32] trong nhiều khoảng thời gian khác nhau. Theo khuyến cáo từ nhà sản xuất (Fermentas), proteinase K đang được sử dụng hoạt động tốt trong khoảng từ 50 đến 65oC và thời gian từ 40 đến 60 phút. Vì vậy, các mốc nhiệt độ 50oC, 56oC và 65oC được khảo sát nhằm xác định nhiệt độ ủ mẫu thích hợp nhất trong kỹ thuật tách chiết DNA. Ở nhiệt độ thích hợp nhất, hai khoảng thời gian ủ mẫu với proteinase K là 40 phút và 60 phút cũng được thử nghiệm và