Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 81 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
81
Dung lượng
1,17 MB
Nội dung
Đại Học Quốc Gia Thành Phố Hồ Chí Minh Trường Đại Học Bách Khoa BÙI VĂN ĐỒNG PHƯƠNG PHÁP ĐẠI SỐ CHO BÀI TOÁN ƯỚC LƯỢNG HỢP LÝ CỰC ĐẠI – ÁP DỤNG TRÊN CÂY SINH LOÀI NHỎ Chuyên ngành: Khoa học Máy tính LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 11 năm 2007 ĐẠI HỌC QUỐC GIA TP HCM CỘNG HOÀ XÃ HỘI CHỦ NGHIÃ VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc Lập - Tự Do - Hạnh Phúc -oOo - Tp HCM, ngày 05 tháng 11 năm 2007 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên : Bùi Văn Đồng Giới tính : Nam ;/ Nữ Ngày, tháng, năm sinh : 10/10/1969 Nơi sinh : Quảng Ngãi Chun ngành : Khoa học Máy tính Khố : 2005 1- TÊN ĐỀ TÀI : PHƯƠNG PHÁP ĐẠI SỐ CHO BÀI TOÁN ƯỚC LƯỢNG HỢP LÝ CỰC ĐẠI – ÁP DỤNG TRÊN CÂY SINH LOÀI NHỎ 2- NHIỆM VỤ LUẬN VĂN : 3- NGÀY GIAO NHIỆM VỤ: 4- NGÀY HOÀN THÀNH NHIỆM VỤ: 5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN : TS Nguyễn Văn Minh Mẫn Nội dung đề cương Luận văn thạc sĩ Hội Đồng Chuyên Ngành thông qua CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN (Họ tên chữ ký) QUẢN LÝ CHUYÊN NGÀNH Họ tên chữ ký) TS Nguyễn Văn Minh Mẫn TS Đinh Đức Anh Vũ CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học : TS Nguyễn Văn Minh Mẫn Cán chấm nhận xét : Cán chấm nhận xét : Luận văn thạc sĩ bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày tháng năm 2007 Phương pháp đại số cho toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chưa có phần nội dung luận văn nộp để lấy cấp trường trường khác Ngày 05 tháng 11 năm 2007 Bùi Văn Đồng Bùi Văn Đồng Trang Phương pháp đại số cho toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ LỜI CẢM ƠN Xin gởi lời cảm ơn chân thành sâu sắc đến TS Nguyễn Văn Minh Mẫn, người Thầy tận tình hướng dẫn tạo điều kiện để tơi hồn thành luận văn Xin gởi lời cảm ơn đến Thầy Cô dạy cho thời gian qua Tôi xin cảm ơn bạn đồng môn đồng nghiệp quan tâm, chia sẻ suốt trình học làm luận văn Luận văn quà nhỏ đáp lại tình cảm gia đình bạn bè thân thích Bùi Văn Đồng Trang Phương pháp đại số cho toán ước lượng hợp lý cực đại - Áp dụng sinh lồi nhỏ TĨM TẮT LUẬN VĂN Cây sinh lồi mơ tả lịch sử tiến hóa nhóm lồi với đặc tính khác có mối quan hệ họ hàng với hình thành từ tổ tiên chung q khứ Đặc tính lồi quan tâm tương ứng với gen Gen chuỗi DNA bao gồm từ kí tự A, G, C T hợp thành Cây sinh loài mà nút (taxa) vật sống ngày nay, nút tổ tiên nút Tái cấu trúc sinh lồi tìm gen phù hợp để đưa vào nút tổ tiên đưa sinh loài phù hợp để giải thích q trình tiến hố Tuy nhiên, việc nghiên cứu sinh loài cho nhiều hướng tiếp cận Mỗi phương pháp có ưu điểm khuyết điểm Phương pháp ước lượng hợp lý cực đại chọn phương pháp phức tạp lại phương pháp cho kết tin cậy Công cụ sử dụng phương pháp Đại số thống kê Đại số máy tính Đó lãnh vực phát triển mạnh mẽ năm gần Thống kê ngành khoa học phân tích liệu Đối với chuỗi DNA thống kê xây dựng mơ hình q trình phát sinh liệu Đưa kết luận chung trình phát sinh Mơ hình thống kê ngun tắc gen Đại số thống kê làm sáng tỏ cho ý tưởng trọng tâm phân tích liệu rời rạc nói riêng phân tích chuỗi sinh học nói riêng Ước lượng hợp lý cực đại (Maximum Likelihood Estimation – MLE) công thức hố Xác suất cổ điển, có tính chất ước lượng tốt Phương pháp MLE đánh giá tham số mơ hình thối lui MLE dẫn đến việc giải làm cực đại tích đa thức Đại số máy tính lãnh vực mới, cung cấp tảng để giải tốn MLE máy tính Đề tài tập trung vào việc nghiên cứu mơ hình xác suất thống kê sinh loài từ liệu gen sinh vật sống Sau sử dụng tảng toán học, đại số máy tính để giải tốn hợp lý cực đại mơ hình xác suất Mục tiêu cuối tìm sinh lồi thích hợp để giải thích tiến hố Những kết luận văn làm sau: - Về phương pháp: Chọn phương pháp đáng tin cậy phương pháp ước lượng hợp lý cực đại cho mơ hình hóa tốn Giải phương trình hợp lý phương pháp tính tốn đại số để tìm kết xác - Về tính tốn: Viết chương trình để mơ hình hóa ước lượng hợp lý cực đại sinh lồi chạy tìm nghiệm phương trình hợp lý số sinh loài nhỏ taxa số mơ hình Bùi Văn Đồng Trang Phương pháp đại số cho toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ DANH MỤC BẢNG Bảng 1: Bảng biến thiên hàm hợp lý .27 Bảng 2: Các mẫu số lượng mẫu chuỗi gen HIVenvSweden với hình móng (U68496, U68497, U68498) .55 Bảng 3: Các mẫu số lượng mẫu chuỗi gen HIVenvSweden với hình lược với trường hợp ((U68496,(U68497, U68498)) .55 Bảng 4: Các mẫu số lượng mẫu chuỗi gen HIVenvSweden với hình lược với trường hợp ((U68498,(U68496, U68497)) .56 Bùi Văn Đồng Trang Phương pháp đại số cho toán ước lượng hợp lý cực đại - Áp dụng sinh lồi nhỏ DANH MỤC HÌNH Hình 1: Hai trường hợp xảy tung đinh bấm 26 Hình 2: Đồ thị hàm hợp lý 27 Hình 3: Cây sinh loài sống 30 Hình 4: Mơ tả xác suất chuyển đổi trạng thái chuỗi “DNA” 32 Hình 5: Cây sinh lồi với nút xác suất chuyển đổi 32 Hình 6: Một sinh loài taxa .35 Hình 7: Cây sinh lồi với liệu nút khả xảy nút tổ tiên.36 Hình 8: Cây sinh lồi có gốc với nút 42 Hình 9: Sơ đồ khối chương trình tìm cấu trúc sinh lồi 53 Hình 10: Hai hình dạng taxa có gốc 55 Hình 11: Cây sinh lồi taxa hình móng 73 Hình 12: Cây sinh lồi taxa hình cần trục 73 Hình 13: Một số sinh loài taxa 73 Bùi Văn Đồng Trang Phương pháp đại số cho toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN TÓM TẮT LUẬN VĂN DANH MỤC BẢNG DANH MỤC HÌNH .5 MỤC LỤC Chương GIỚI THIỆU ĐỀ TÀI 1.1 1.2 Giới thiệu Cấu trúc luận văn 10 Chương CƠ SỞ LÝ THUYẾT VỀ CÁC CẤU TRÚC ĐẠI SỐ VÀ XÁC SUẤT THỐNG KÊ 12 2.1 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.1.6 2.1.7 2.1.8 2.2 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.2.7 Một số cấu trúc đại số bàn 12 Lý thuyết nhóm .12 Lý thuyết vành 13 Trường 14 Vành đa thức .14 Ma trận 15 Định thức 15 Không gian vector 16 Đa tạp đại số .18 Các khái niệm xác suất thống kê 18 Định nghĩa xác suất 18 Xác suất có điều kiện 19 Đại lượng ngẫu nhiên hàm phân phối 20 Các đặc trưng đại lượng ngẫu nhiên 20 Lý thuyết mẫu 21 Ước lượng tham số 22 Sơ lược ước lượng hợp lý cực đại 22 Chương ƯỚC LƯỢNG HỢP LÝ CỰC ĐẠI TRÊN MẪU QUAN SÁT 25 3.1 3.1.1 3.1.2 3.1.3 3.2 3.2.1 3.2.2 3.3 3.3.1 Bùi Văn Đồng Ước lượng hợp lý cực đại gì? 25 Đặt vấn đề 25 Khái quát ước lượng hợp lý cực đại 25 Ví dụ ước lượng hợp lý cực đại 26 Giải toán ước lượng hợp lý cực đại 26 Nguyên lý ước lượng hợp lý cực đại 26 Logarit hàm hợp lý 26 Tổng qt hóa tốn ước lượng hợp lý cực đại 27 Ước lượng hợp lý cực đại mẫu quan sát 27 Trang Phương pháp đại số cho toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ 3.3.2 Một số phương pháp giải phương trình hợp lý 28 Chương CÂY SINH LỒI - MƠ HÌNH XÁC SUẤT THỐNG KÊ TRÊN CÂY SINH LOÀI .30 4.1 4.2 4.3 4.4 Giới thiệu sơ lược sinh loài 30 Các nghiên cứu phát sinh sinh loài 31 Mơ hình ước lượng hợp lý cực đại sinh loài 32 Mơ hình tiến hóa 33 Chương BẤT BIẾN TRÊN CÂY SINH LOÀI .37 5.1 5.2 5.2.1 5.2.2 5.3 5.4 5.5 5.5.1 5.5.2 5.5.3 5.5.4 5.5.5 5.6 Dẫn nhập 37 Mơ hình xác suất sinh loài 38 Mơ hình tốn sinh loài 38 Nhóm Abel liên hệ với ma trận chuyển đổi 39 Biến đổi Fourier 40 Toạ độ Fourier 42 Áp dụng tìm bất biến sinh loài 42 Mơ hình tốn .42 Các khả xảy nút 43 Các lớp xác suất tương đương 43 Chuyển đổi Fourier 44 Kết tìm 45 Những tính chất thành phần bất biến 46 Chương GIẢI PHƯƠNG TRÌNH HỢP LÝ 47 6.1 6.2 6.2.1 6.2.2 6.2.3 6.3 6.4 6.5 6.6 Quỹ tích hợp lý đa tạp 47 Ma trận Jacobi đa thức bất biến 47 Gradient- Vector vận tốc 47 Ma trận Jacobi đa thức bất biến 48 Không gian tiếp xúc 49 Bài toán cực trị điều kiện 49 Bậc hợp lý cực đại 50 Các thuật toán 50 Áp dụng giải phương trình hợp lý 51 Chương CHƯƠNG TRÌNH THỰC HIỆN 53 7.1 7.2 7.3 Sơ đồ khối chương trình 53 Sơ lược chương trình 54 Kết chương trình 54 Chương TỔNG KẾT – ĐÁNH GIÁ 57 8.1 8.2 8.3 Tổng kết 57 Những đóng góp luận văn 57 Hướng phát triển 58 TÀI LIỆU THAM KHẢO 59 Bùi Văn Đồng Trang Phương pháp đại số cho toán ước lượng hợp lý cực đại - Áp dụng sinh lồi nhỏ Phụ lục Trích số SourceCodes chương trình viết Singular //file lib_header.sing, khởi tạo môi trường, đọc file liệu phân tích //dữ liệu: số taxa sinh lịai, liệu từ file chuyển sang mảng để dóng //cột system(" no-out",1); system(" no-warn",1); LIB "control.lib"; LIB "solve.lib"; LIB "presolve.lib"; LIB "linalg.lib"; int i,j,ii,jj,kk; string sr,sR; write(":w outfile.txt","number MinLn= -100000;"); write(":w rootfile.txt",""); string file=""+read("filedata.txt"); string s=""+read(file); printf("=====================PROGRAM====================="); printf("====================File Data====================="); printf("%s",s); list StringName; string temp=""; for(i=1;s[i]!=newline;i++) { temp=temp+s[i]; } string so="int n="+temp+";"; execute(so); printf(" -Number Taxa: %s",n); temp=""; for(i++;s[i]!=newline;i++) { temp=temp+s[i]; } so="int len ="+temp+";"; execute(so); printf(" -Length Taxa: %s",len); list st; for(int j=1;j