.6 Bảng thống kê số lượng trên từng SNP với 2 phần mềm

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng thuật toán burrows wheeler transform trong quá trình giải mã hệ gen lúa tại việt nam (Trang 75 - 80)

Hình 3.6 Tỷ lệ gióng hàng và thời gian chạy bởi công cụ BWTAligner

3.5 Đánh giá kết quả của luận văn

Việt Nam là một đất nước có nền nơng nghiệp phát triển mạnh hàng đầu Châu Á. Đặc biệt, đây chính là một trong những trung tâm phát sinh và đa dạng di truyền nguồn gen cây lúa. Với sự đa dạng về khí hậu vùng miền, hiện nay đất nước ta có nhiều tập

học mà bên cạnh đó cịn cần sự hiểu biết sâu rộng về nền tảng công nghệ nhằm ứng dụng hiệu quả công nghệ thông tin vào lĩnh vực sinh học nước nhà.

Trước những thách thức ngày càng lớn cho nghành nông nghiệp Việt Nam trong thời đại hội nhập và phát triển kinh tế trên thị trường quốc tế, việc nghiên cứu giải mã hệ gen cây lúa được đặc biệt coi trọng. Dưới góc độ nghiên cứu về lĩnh vực Tin sinh học và trên khn khổ đề tài luận văn của mình, em đã hiểu được nhu cầu giải mã hệ gen lúa bản địa tại Việt Nam là cần thiết.

Song song với đề tài giải mã hệ gen 36 giống lúa tại Việt Nam của phòng Tin Sinh, thuộc Viện Công nghệ sinh học, Viện Hàn lâm KH&CN Việt Nam, bản thân em đã cùng nhóm xây dựng cơng cụ gióng hàng trình tự BWTAigner và đưa ra đánh giá về kết quả thu được so với cơng cụ gióng hàng phổ biến hiện nay (BWA). Có thể thấy cơng cụ xây dựng BWTAligner có kết quả thu được đạt hiệu quả chưa bằng cơng cụ gióng hàng phổ biến BWA. Tuy nhiên với những gì bản thân đã tìm hiểu và đóng góp thì hiệu quả đạt được của công cụ BWTAlinger gần đã đạt được hiệu quả mong muốn. Cần có những thử nghiệm trên nhiều bộ dữ liệu khác trong tương lai và với những góp ý, nghiên cứu tiếp tục của các nhà Tin – Sinh học giúp cơng cụ BWTAligner có thể trở nên hoàn thiện hơn nữa.

KẾT LUẬN

Trong luận văn này,tôi đã nghiên cứu một số thuật toán liên quan đến gióng hàng trình tự như thuật tốn ma trận điểm và thuật toán Smith Waterman, tập trung trọng tâm vào thuật toán Burrow – Wheeler Tranform. Luận văn đã nêu bật được ưu nhược điểm của từng thuật toán, BWT cho thấy sự tối ưu khi ứng dụng với dữ liệu lớn. Điều này có ý nghĩa quan trọng trong các bài tốn về sinh học. Bởi vì với sự phát triển mạnh mẽ của cơng nghệ giải trình tự sẽ cho ra đời một số lượng lớn đoạn trình tự. Do đó, so sánh và gióng hàng lượn lớn trình tự này trên hệ gen tham chiếu với tốc độ nhanh, chính xác là một vấn đề khơng hề nhỏ. Với ưu điểm có thể thực hiện được với dữ liệu lớn nên có rất nhiều phần mềm dựa trên thuật tốn BWT được phát triển để gióng hàng trình tự vào dữ liệu tham chiếu từ đó tìm ra biến dị/ đa hình

Tơi đã tham gia xây dựng, cài đặt và thử nghiệm thành công cơng cụ gióng hàng trình tự BWTAligner. Thực nghiệm cơng cụ trên dự liệu giả lập từ hệ gen lúa với 3 mức độ bao phủ khác nhau 5X, 15X và 30X và đặc biệt thực nghiệm trên giống lúa Chiêm Nhỡ (Bắc Ninh) và đưa ra những đánh giá kết quả so với công cụ BWA đã được triển khai trên thực tế.

TÀI LIỆU THAM KHẢO

Tiếng Việt

1. Nguyễn Văn Cách (2006), Giáo trình tin sinh học, NXB Khoa học kỹ thuật, Hà Nội..

Tiếng Anh

2. Burrows, M. and Wheeler, D.J. (1994), “A block-sorting lossless data compression algorithm”, Technical report, 124.

3. Campagna, D. et al. (2009), “PASS: a program to align short sequences”,

Bioinformatics, 25, pp. 967–968.

4. Li, H. et al (2008), “Mapping short DNA sequencing reads and calling variants using mapping quality scores”, Genome Res, 18, 1851–1858. 5. Li, H. et al (2009), “The sequence alignment/map format and SAMtools”,

Bioinformatics, 25(16), PP. 2078-2079.

6. Li Heng and Richard Durbin (2009), “Fast and Accurate Short Read Alignment with Burrows-Wheeler Transform”, Bioinformatics, 25, pp.

1754–1760.

7. Li, H., et al. (2009), "The sequence alignment/map format and SAMtools."

Bioinformatics, 25(16), PP. 2078-2079.

8. Alkan, C., et al. (2011), "Genome structural variation discovery and genotyping", Nature Reviews Genetics, 12(5), pp. 363-376.

10. Feuk. L., et al. (2010), "Inversion variants in the human genome: role in disease and genome architecture.", Genome Med, 2(11), pp. 250-276.

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng thuật toán burrows wheeler transform trong quá trình giải mã hệ gen lúa tại việt nam (Trang 75 - 80)

Tải bản đầy đủ (PDF)

(80 trang)