Tin Sinh học (Bioinformatics) là một lĩnh vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa học và hóa sinh để giải quyết các vấn đề sinh học. Sự ra đời của Tin Sinh học là sự hợp tác chặt chẽ giữa các nhà Tin học và các nhà nghiên cứu Sinh học nhằm khai phá dữ liệu hiệu quả, Tin – Sinh học đã trở thành mục tiêu công nghệ của ngành Sinh học trong thế kỉ mới. Bắt kịp xu thế phát triển của khoa học thế giới, những năm gần đây các nhà Tin Sinh học Việt Nam đã xác định được những hướng đi phù hợp và đạt được thành công bước đầu với một số công trình nghiên cứu mang tính ứng dụng cao. Trong sinh học, việc giải mã trình tự gen rất quan trọng, nó góp phần trong việc nghiên cứu sinh học cơ bản và trong nhiều lĩnh vực ứng dụng như chẩn đoán bệnh tật, công nghệ sinh học, sinh học pháp y, sinh học hệ thống... Do đặc tính khí hậu nhiệt đới, Việt Nam có những lợi thế về những nguồn dữ liệu Sinh học to lớn, hữu ích, điều đó trở thành một điều kiện thuận lợi và cũng là thách thức cần đến sự đóng góp của Tin Sinh học. Nhận thấy tính mới mẻ trong lĩnh vực nghiên cứu Tin – Sinh học nói chung cũng như những ưu điểm phát triển của nghành Tin Sinh học nước nhà, học viên đã lựa chọn đề tài “ứng dụng thuật toán Burrow – Wheeler Tranform trong quá trình giải mã hệ gen lúa”. Luận văn bao gồm ba chương chính, nội dung tóm lược như sau: Chương 1 trình bày tổng quan và các khái niệm cơ bản trong sinh học phân tử, các định dạng dữ liệu trong bài toán Tin – Sinh học. Mục tiêu chính của chương này nhằm làm rõ các khái niệm giới thiệu vấn đề và nội dung sẽ trình bày trong chương tiếp theo của luận văn. Chương 2 trình bày quá trình giải mã hệ gen, bài toán gióng hàng trình tự trong việc giải mã hệ gen. Chương 2 sẽ nêu một số thuật toán cơ bản giải bài toán gióng hàng trình tự. Trọng tâm của chương 2 giới thiệu ý tưởng và quá trình xây dựng thuật toán Burrows–Wheeler Transform trong quá trình giải mã hệ gen. Chương 3 Trình bày về quá trình thực nghiệm và ứng dụng thuật toán trên dữ liệu sinh học. Tác giả tham gia cùng nhóm nghiên cứu thuộc phòng Tin – Sinh học, viện Công nghệ Sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam xây dựng công cụ dóng hàng trình tự BWTAligner dựa trên thuật toán BWT đã tìm hiểu. Đối chứng kết quả khi dóng hàng trình tự trên công cụ dóng hàng phổ biến BWA. Trong chương này thực hiện từng bước chuẩn bị dữ liệu, cài đặt môi trường, sử dụng công cụ, đưa ra kết quả thực nghiệm và đánh giá kết quả của luận văn.