Luận Án Tiến Sĩ Công Nghệ Thông Tin Xây Dựng Đồ Thị Tái Tổ Hợp Di Truyền Cho Dữ Liệu Hệ Gen.docx

104 2 0
Luận Án Tiến Sĩ Công Nghệ Thông Tin  Xây Dựng Đồ Thị Tái Tổ Hợp Di Truyền Cho Dữ Liệu Hệ Gen.docx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Thị Phương Thảo XÂY DỰNG ĐỒ THỊ TÁI TỔ HỢP DI TRUYỀN CHO DỮ LIỆU HỆ GEN LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2020 ĐẠI HỌC QUỐC GIA HÀ NỘ[.]

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Thị Phương Thảo XÂY DỰNG ĐỒ THỊ TÁI TỔ HỢP DI TRUYỀN CHO DỮ LIỆU HỆ GEN LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2020 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Thị Phương Thảo XÂY DỰNG ĐỒ THỊ TÁI TỔ HỢP DI TRUYỀN CHO DỮ LIỆU HỆ GEN Chuyên ngành: Khoa học Máy tính Mã số: 9480101.01 LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: 1.PGS.TS Lê Sỹ Vinh 2.PGS.TS Lương Chi Mai Hà Nội – 2020 Lời cam đoan Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các kết viết chung với tác giả khác đồng ý đồng tác giả trước đưa vào luận án Các kết nêu luận án trung thực chưa cơng bố cơng trình khác Tác giả Nguyễn Thị Phương Thảo Lời cảm ơn Luận án thực Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội, hướng dẫn PGS TS Lê Sỹ Vinh PGS TS Lương Chi Mai Tơi xin bày tỏ lịng biết ơn sâu sắc tới PGS TS Lê Sỹ Vinh, PGS TS Lương Chi Mai TS Lê Sĩ Quang, người có định hướng giúp tơi thành cơng việc nghiên cứu Các Thầy Cơ động viên khích lệ tinh thần, giúp tơi vượt qua khó khăn để tơi hồn thành luận án Tôi chân thành cảm ơn thầy Hồ Tú Bảo, Thầy cho nhiều kiến thức quý báu nghiên cứu khoa học Những bảo quý giá Thầy Cơ giúp tơi hồn thành tốt luận án Tôi xin cảm ơn tới Thầy, Cô thuộc Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội tạo điều kiện thuận lợi giúp q trình làm nghiên cứu sinh Tơi xin chân thành cảm ơn đồng nghiệp phòng Nhận dạng Công nghệ Tri thức, Viện Công nghệ Thông tin, Viện Hàn lâm Khoa học Công nghệ Việt Nam ln động viên, tạo điều kiện thuận lợi, bố trí thời gian tốt cho tơi suốt q trình làm nghiên cứu sinh Cuối cùng, xin gửi lời cảm ơn sâu sắc tới gia đình bạn bè, người cho điểm tựa vững để tơi có thành cơng ngày hơm MỤC LỤC Lời cam đoan .1 Lời cảm ơn MỤC LỤC Danh mục ký hiệu chữ viết tắt Danh mục bảng .7 Danh mục hình vẽ, đồ thị Danh mục thuật toán 12 MỞ ĐẦU 13 Chương 1.GIỚI THIỆU 16 1.1 Giới thiệu chung 16 1.1.1 Hệ gen người 16 1.1.2 Mạng phát sinh loài 21 1.2 Xây dựng đồ thị tái tổ hợp di truyền 23 1.2.1 Sự kiện tái tổ hợp .23 1.2.2 Đồ thị tái tổ hợp di truyền 25 1.2.3 Bài toán xây dựng đồ thị ARG 32 1.3 Các phương pháp xây dựng đồ thị ARG .35 1.3.1 Các phương pháp xây dựng đồ thị ARG tối thiểu .35 1.3.2 Các phương pháp xây dựng đồ thị ARG hợp lý 39 1.3.3 Tổng hợp phần mềm xây dựng đồ thị ARG 41 1.4 Ứng dụng ARG nghiên cứu tương quan toàn hệ gen .42 1.5 Kết luận chương 45 Chương 2.THUẬT TOÁN ARG4WG XÂY DỰNG ĐỒ THỊ TÁI TỔ HỢP DI TRUYỀN HỢP LÝ CHO DỮ LIỆU HỆ GEN 47 2.1 Giới thiệu 47 2.1.1 Các định nghĩa 47 2.1.2 Thuật toán Margarita xây dựng đồ thị ARG 48 2.2 Thuật toán ARG4WG 51 2.2.1 Chiến lược tìm đoạn đầu chung dài 51 2.2.2 Thuật toán ARG4WG 54 2.3 Kết thực nghiệm 61 2.3.1 Các kết liệu thật 61 2.3.2 Các kết liệu mô 65 2.4 Kết ứng dụng ARG4WG vào tốn tìm vùng gen liên quan đến bệnh sốt rét Châu Phi .67 2.5 Kết luận chương 72 Chương PHƯƠNG PHÁP TỐI ƯU HÓA SỐ SỰ KIỆN TÁI TỔ HỢP TRONG QUÁ TRÌNH XÂY DỰNG ĐỒ THỊ ARG 75 3.1 Giới thiệu 75 3.2 Một số định nghĩa khái niệm sử dụng thuật toán 76 3.3 Hạn chế thuật toán ARG4WG 78 3.4 Thuật toán REARG .79 3.4.1 Động nghiên cứu 79 3.4.2 Thuật toán REARG 80 3.5 Thuật toán GAMARG 83 3.5.1 Động nghiên cứu 83 3.5.2 Thuật toán GAMARG 83 3.6 Kết thực nghiệm 88 3.6.1 Kết tập liệu nhỏ 89 3.6.2 Các kết tập liệu từ dự án 1kGP .90 3.7 Kết luận chương 98 KẾT LUẬN 100 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 102 TÀI LIỆU THAM KHẢO .103 Danh mục ký hiệu chữ viết tắt D Tập trình tự N Số lượng trình tự tập trình tự m độ dài trình tự Sx Trình tự thứ x tập trình tự Sx[i] Giá trị Sx vị trí thứ i ARG Đồ thị tái tổ hợp di truyền 1KGP Dự án 1000 hệ gen GWAS Nghiên cứu tương quan toàn hệ gen SNP Đa hình đơn nucleotit MRCA Tổ tiên chung gần CwR Mơ hình kết hợp tái tổ hợp STT Số thứ tự RF Khoảng cách Robinson-Fould Danh mục bảng Bảng 1.1: Các phần mềm xây dựng đồ thị ARG tiêu biểu 41 Bảng 2.1: Tập liệu trích xuất từ dự án 1000 hệ gen người .62 Bảng 3.1: Tập liệu từ dự án 1kGP 89 Bảng 3.2: Các kết thuật toán khác tập liệu nhỏ 89 Bảng 3.3: Số kiện tái tổ hợp tìm thấy thuật tốn cho 100 trình tự (a) DS1, (b) DS2 (c) DS3 .91 Bảng 3.4: Số kiện tái tổ hợp tìm thấy thuật tốn cho 200 trình tự (a) DS1, (b) DS2 (c) DS3 .92 Bảng 3.5: Trung bình thời gian chạy (giây) thuật tốn cho 100 trình tự tập liệu (a) DS1, (b) DS2, (c) DS3 95 Bảng 3.6: Trung bình thời gian chạy (giây) thuật tốn cho 200 trình tự tập liệu (a) DS1, (b) DS2, (c) DS3 97 Danh mục hình vẽ, đồ thị Hình 1.1: Cấu trúc hệ gen người Hệ gen người gồm 23 cặp nhiễm sắc thể, có khoảng tỉ phân tử DNA, khoảng 20.000 đến 25.000 gen Nguồn hình: https://genomainternational.com/introduction-to-genomics/ 16 Hình 1.2: Các kiểu biến thể trình tự: (a) Thay cặp bazơ đơn Trong ví dụ, biến thể xuất vị trí so với trình tự tham chiếu, thay nucleotit T↔A G↔A (b) Chuỗi GCA chèn vào so với trình tự tham chiếu (c) Chuỗi CG bị xóa so với trình tự tham chiếu .17 Hình 1.3: Các loại biến thể cấu trúc: xóa, thêm, lặp, đảo hay lặp nhiều lần đoạn DNA Đoạn đột biến cấu trúc có kích thước lớn 1kb 18 Hình 1.4: Ví dụ liệu SNP chứa biến thể alen nhiều alen Có vị trí SNP alen, gồm alen tham chiếu alen biến thể, ví dụ A G vị trí 1; T C vị trí Chỉ có vị trí alen: alen tham chiếu (G) alen biến thể C, T 19 Hình 1.5: Ví dụ haplotype cá thể vùng gen Một haplotype tạo thành từ kết hợp SNP di truyền đoạn DNA .19 Hình 1.6: Cây phân lồi biểu diễn mối quan hệ tiến hóa số loài linh trưởng Đười ươi Khỉ đột rẽ nhánh sớm loài linh trưởng khác Con người rẽ nhánh riêng nhánh lại cho Tinh tinh vượn Bonobo .21 Hình 1.7: Khái qt hóa mạng phát sinh lồi điển hình [36] 23 Hình 1.8: Hai tượng tái tổ hợp phổ biến người: (a) trao đổi chéo (b) chuyển đổi gen .24 Hình 1.9: Biến đổi liệu SNP thành dạng nhị phân Vị trí có giá trị giống với tham chiếu 0, giá trị khác tham chiếu 28

Ngày đăng: 15/05/2023, 10:15

Tài liệu cùng người dùng

Tài liệu liên quan