1. Giới thiệu chung về ty thể
3.4.1. Các SNPs được công bố trên Ngân hàng Gen
Chúng tôi đã tiến hành tìm các vị trí đa hình (SNPs) của HV1 trong vùng D – Loop của hệ gen ty thể người đã được công bố trên Ngân hàng Gen từ trang web
http://mitomap.org. Bảng danh sách này liệt kê 76 SNPs từ vị trí 16192 đến 16368 được sử dụng như danh sách tham chiếu để so sánh với danh sách SNPs ở nhóm người Việt Nam trong nghiên cứu này. Các thông tin về SNPs được thống kê trên website trên gồm nhiều vùng khác nhau trong gen ty thể. Tuy nhiên trong khuôn khổ luận văn này, chúng tôi chỉ tập trung nghiên cứu vùng HV1 của D – Loop, chính vì thế bảng 3.4 này chỉ có thông tin về: Vị trí SNP, locus, vùng gen, nucleotit thay đổi của vùng siêu
biến HV1, còn các SNP ở vùng khác thì tham khảo thêm ở http://mitomap.org.
Bảng 3.4. Vị trí đa hình HV1 trong vùng D – Loop được công bố trên Ngân hàng Gen
3.4.2. Các vị trí đa hình (SNPs) ở HV1 trong vùng D – Loop của người Việt Nam
Sau khi việc giải trình tự các mẫu sinh phẩm có kết quả, việc tiếp theo là chúng tôi phân tích và tìm kiếm các SNPs của người Việt Nam sử dụng phần mềm NovoSNP
(Bỉ) http://www.molgen.ua.ac.be/bioinfo/novosnp. NovoSNP là một phần mềm dễ sử
dụng và có tính hiệu quả cao, cho kết quả đáng tin cậy đối với sự phát hiện các biến thể trình tự ở cả các SNP và INDELS, cũng như trong việc chọn lọc các biến thể trình tự đối với đột biến gây bệnh hoặc là phát hiện SNP. Người ta cũng đã so sánh các đột biến được phát hiện ở phần mềm này với 2 phần mềm PolyPhred và PolyBayes, kết quả cho thấy các giá trị chọn lọc cao có thể dùng để xây dựng bản đồ SNP.
Hình 3.3. Phần mềm NovoSNP khi phân tích mẫu
Dựa trên kết quả phân tích thông qua phần mềm NovoSNP đã tìm được 44 vị trí đa hình từ 16194 đến 16359 trong vùng HV1 của người Việt Nam. Xem bảng 3.5.
Bảng 3.5. SNPs được tìm thấy trong HV1 ở mẫu sinh phẩm Việt Nam (NovoSNPS)
Ở bảng 3.5 dễ nhận thấy giá trị Score và Fscore càng cao thì khả năng đa hình càng chính xác. Theo kết quả nêu tại Bảng 3.5 dựa trên thuật toán của phần mềm NovoSNP thì tại vị trí 16194, giá trị Score: 66 và Fscore: 51 là tương đối cao. Điều này cho thấy khả năng chèn Nucleotit C (Insert C) vào vị trí này là rất cao trong các đối tượng người Việt Nam tham gia nghiên cứu này. Điều này còn được thể hiện rõ hơn qua hình 3.3 sau khi so sánh với trình tự rCRS sử dụng NovoSNP. Điểm chèn Nucleotit C ở vị trí 16194 xảy ra ở hầu hết các trình tự của những mẫu tham gia (vị trí được đánh dấu màu đỏ trong hình 3.4). Tuy nhiên ở đây chúng tôi không liệt kê ra hết các trình tự mà chỉ đưa ra một số trình tự tiêu biểu kể cả những trình tự có giá trị Score: 16 và Fscore: 16, thấp hơn rất nhiều so với vị trí 16194 nhưng NovoSNP cũng đã đưa ra được tính đa hình cao và đảm bảo độ tin cậy như tại vị trí 16381 thay đổi Nucleotit T →A (vị trí được đánh dấu màu đỏ như trong hình 3.5). (Stefan Weckx và cộng sự. 2005).
Hình 3.5. SNP tại vị trí 16381