Phương pháp đại số cho hài toán ước lượng hợp lý cực đại áp dụng trên cây sinh loài nhỏ

64 200 0
Phương pháp đại số cho hài toán ước lượng hợp lý cực đại   áp dụng trên cây sinh loài nhỏ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Học CỘNG Quốc HOÀ Gia XÃ Thành PhốNGHIÃ Hồ Chí Minh ĐẠI HỌC QUỐC GIAĐại TP HCM HỘI CHỦ VIỆT NAM Trường Đại Học Bách Khoa TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc Lập - Tự Do - Hạnh Phúc NHIỆM VỤ LUẬN VĂN THẠC sĩ Họ tên học viên : Bùi Văn Đồng Giới tính : Nam 0/ Nữ □ Ngày, tháng, năm sinh : 10/10/1969 Nơi sinh : Quảng Ngãi BÙI VĂN ĐÒNG Chuyên ngành : Khoa học Máy tính Khoá : 2005 PHƯƠNG PHÁP ĐẠI SỐ CHO BÀI TOÁN ƯỚC LỨỢNG HỢP LÝ cực ĐẠI - ÁP DỤNG TRÊN CAY Nội dung đề cương Luận văn thạc sĩ Hội Đồng Chuyên Ngành thông qua TS Nguyễn Văn Minh Mần TS Đinh Đức Anh Vũ CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI Cán chấm nhận xét : Cán chấm nhận xét : Luận văn thạc sĩ bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC sĩ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày tháng năm 2007 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ công trình khác ghi rõ luận văn, công việc trình bày luận văn thực chưa có phần nội dung luận văn nộp để lấy cấp trường trường khác Ngày 05 tháng 11 năm 2007 Bùi Văn Đồng Bùi Vãn Đồng Trang Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ LỚI CAM ƠN Xin gởi lời cảm ơn chân thành sâu sắc đến TS Nguyễn Văn Minh Man, nguời Thầy tận tình huớng dẫn tạo điều kiện để hoàn thành luận văn Xin gởi lời cảm ơn đến Thầy Cô dạy cho thời gian qua Tôi xin cảm ơn bạn đồng môn đồng nghiệp quan tâm, chia sẻ suốt trình học làm luận văn Luận văn quà nhỏ đáp lại tình cảm gia đình bạn bè thân thích Bùi Vãn Đồng Trang Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ TÓM TẮT LUẬN VĂN Cây sinh loài mô tả lịch sử tiến hóa nhóm loài với đặc tính khác có mối quan hệ họ hàng với hình thành từ tổ tiên chung khứ Đặc tính loài quan tâm tương ứng với gen Gen chuỗi DNA bao gồm từ kí tự A, G, c T hợp thành Cây sinh loài mà nút (taxa) vật sống ngày nay, nút tổ tiẽn nút Tái cấu trúc sinh loài tìm gen phù hợp để đưa vào nút tổ tiên đưa sinh loài phù hợp để giải thích trình tiến hoá Tuy nhiên, việc nghiên cứu sinh loài cho nhiều hướng tiếp cận Mỗi phương pháp có ưu điểm khuyết điểm Phương pháp ước lượng họp lý cực đại chọn phương pháp phức tạp lại phương pháp cho kết tin cậy Công cụ sử dụng phương pháp Đại số thống kê Đại số máy tính Đó lãnh vực phát triển mạnh mẽ năm gần Thống kê ngành khoa học phân tích liệu Đối với chuỗi DNA thống kê xây dựng mô hình trình phát sinh liệu Đưa kết luận chung trình phát sinh Mô hình thống kê nguyên tắc gen Đại số thống kê làm sáng tỏ cho ý tưởng trọng tâm phân tích liệu rời rạc nói riêng phân tích chuỗi sinh học nói riẽng Ước lượng hợp lý cực đại (Maximum Likelihood Estimation - MLE) công thức hoá Xác suất cổ điển, có tính chất ước lượng tốt Phương pháp MLE đánh giá tham số mô hình thối lui MLE dẫn đến việc giải làm cực đại tích đa thức Đại số máy tính lãnh vực mới, cung cấp tảng để giải toán MLE máy tính Đe tài tập trung vào việc nghiên cứu mô hình xác suất thống kê sinh loài từ liệu gen sinh vật sống Sau sử dụng tảng toán học, đại số máy tính để giải toán họp lý cực đại mô hình xác suất Mục tiêu cuối tìm sinh loài thích họp để giải thích tiến hoá Những kết luận văn làm sau: phương pháp: Chọn phương pháp đáng tin cậy phương pháp ước lượng họp lý cực đại cho mô hình hóa toán Giải phương trình họp lý phương pháp tính toán đại số để tìm kết xác - tính toán: Viết chương trình để mô hình hóa ước lượng hợp lý cực đại sinh loài chạy tìm nghiệm phương trình họp lý số sinh loài nhỏ taxa số mô hình Bùi Vãn Đồng Trang Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ DANH MỤC BANG Bảng 1: Bảng biến thiên hàm họp lý 27 Bảng 2: Các mẫu số lượng mẫu chuỗi gen HIVenvSweden với hình móng (U68496, U68497, U68498) .55 Bảng 3: Các mẫu số lượng mẫu chuỗi gen HIVenvSweden với hình lược với trường hợp ((Ui68496,(U68497, U68498)) 55 Bùi Vãn Đồng Trang Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ DANH MỤC HÌNH Hình 1: Hai trường họp xảy tung đinh bấm 26 Hình 2: Đồ thị hàm họp lý 27 Hình 3: Cây sinh loài sống 30 Hình 4: Mô tả xác suất chuyển đổi trạng thái chuỗi “DNA” 32 Hình 5: Cây sinh loài với nút xác suất chuyển đổi 32 Hình 6: Một sinh loài taxa .35 Hình 7: Cây sinh loài với liệu trẽn nút khả xảy nút tổ tiên.36 Hình 8: Cây sinh loài có gốc với nút 42 Bùi Vãn Đồng Trang Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN TÓM TẮT LUẬN VĂN DANH MỤC BẢNG DANH MỤC HÌNH MỤC LỤC Chương GIỚI THIỆU ĐÈ TÀI 1.1 Giói thiệu 1.2 Cấu trúc luận văn 10 Chương SỞ LÝ THUYẾT VỀ CÁC CẤUTRÚC ĐẠI SỐ VÀ XÁC SUẤT THỐNG KÊ 12 2.1 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.1.6 2.1.7 2.1.8 2.2 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.2.7 Một số cấu trúc đại số bàn 12 Lý thuyết nhóm 12 Lý thuyết vành 13 Trường 14 Vành đa thức 14 Ma trận 15 Định thức 15 Không gian vector 16 Đa tạp đại số 18 Các khái niệm xác suất thống kê 18 Định nghĩa xác suất 18 Xác suất có điều kiện 19 Đại lượng ngẫu nhiên hàm phân phối 20 Các đặc trưng đại lượng ngẫu nhiên 20 Lý thuyết mẫu 21 Ước lượng tham số 22 Sơ lược ước lượng hợp lý cực đại 22 Chương ƯỚC LƯỢNG HỢP LÝ cực ĐẠI TRÊNMẪU QUAN SÁT .25 3.1 3.1.1 3.1.2 Bùi Vãn Đồng Ước lượng hợp lý cực đại gì? 25 Đặt vấn đề 25 Khái quát ước lượng họp lý cực đại 25 Trang Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ 3.3.2 Một số phương pháp giải phương trình hợp lý 28 Chương CÂY SINH LOÀI - MÔ HÌNH XÁC SUẤT THÓNG KÊ TRÊN CÂY SINH LOÀI 30 4.1 Giói thiệu sơ lược sinh loài 30 4.2 Các nghiên cứu phát sinh sinh loài 31 4.3 Mô hình ước lượng họp lý cực đại sinh loài 32 4.4 Mô hình tiến hóa 33 Chương BẤT BIÉN TRÊN CÂY SINH LOÀI 37 5.1 Dần nhập 37 5.2 Mô hình xác suất sinh loài 38 5.2.1 5.2.2 Mô hình toán sinh loài 38 Nhóm Abel liên hệ với ma trận chuyển đổi 39 5.3 Biến đổi Fourier 40 5.4 Toạ độ Fourier 42 5.5 Áp dụng tìm bất biến sinh loài 42 5.5.1 5.5.2 5.5.3 5.5.4 5.5.5 5.6 Mô hình toán 42 Các khả xảy nút 43 Các lóp xác suất tương đương 43 Chuyển đổi Fourier 44 Ket tìm .45 Những tính chất thành phần bất biến 46 Chương GIẢI PHƯONG TRÌNH HỢP LÝ 47 6.1 Quỹ tích họp lý đa tạp 47 6.2 Ma trận Jacobi đa thức bất biến 47 6.2.1 6.2.2 6.2.3 Gradient- Vector vận tốc 47 Ma trận Jacobi đa thức bất biến 48 Không gian tiếp xúc 49 6.3 Bài toán cực trị điều kiện 49 6.4 Bậc họp lý cực đại 50 Bùi Vãn Đồng Trang Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ Phụ lục Tập xác suất trình bày chương 60 Phụ lục Tập liệu kết thực trình bày chương 62 Phụ lục Trích số SourceCodes chương trình viết Singular .64 Phụ lục Một số kết chương trình sinh loài taxa 68 Bùi Vãn Đồng Trang Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ Chương CHƯƠNG TRÌNH THỰC HIỆN 7.1 Sơ đồ khối chương trình / X X Output: Cây sinh loài có hàm hợp X lý lớn x^ T (^End^) Bùi Văn Đồng Trang 53 Các mẫu Số Các mẫu Số Các mẫu Số Phương Phươngpháp phápđại đạisốsốcho chohài hàitoán toánước ướclượng lượnghợp hợplýlýcực cựcđại đại- -Áp Ápdụng dụngtrên trêncây câysinh sinhloài loàinhỏ nhỏ liệu tương ứng là:chúng u = (247, 8,tìm 17,mối 1) kếthệ Với gen mục đíchchương ta làtrình liên tổkhi tiênchạy giữachương chúng Có 7.2.Vector Sơ lược dạng taxa có gốc hình 10 =(0.9027837320165, 0.03154973251390, 0.0640321523858, 0.001634383083735) giá trị hàm ỉ(p)trên = -106.0495469 Bài toán chia thành nhiều toán nhỏ tách rời Vì để chọn ngôn ngữ lập trình đến Trong /Xcũng cần tính Trường hoy 2: phù Các hợp nút tươngcông ứngđoạn (Ư68497ẠJJ68496, U68498)) số luận văn ngữ chọn để viếttrên kiểmcột nghiệm truờng ngônhọp ngữnày C++ lượng cácnày, mẫuhai dữngôn liệu quan sát so dóng giống Singular Gói phần mềm viết C++ giải phần đầu toán xác định bảng 2, vìCây tương trường họp taxavàtự hình Cây3 xác suất xảy trên3cây đếmmóng số lượng vector liệu u taxa hình lược Trường hov 3: Các nút tương ứng (U68498,(U68496, U6849T)) số Phần quan sát chương trình làcây tìm3các phần bất biến giải lượng mẫu trọng liệu quan dóng cột thành đối truờng họp Hình 10:khi Haisohình dạng taxa có với phương trình hợp lý viết ngôn ngữ Singular (Xem phụ lục 3) Singular bảng hệ thốnggốc phương pháp tính toán đa thức, đại số giao hoán hình học đại số Nó gói phần mềm hữu hiệu cho đại số thống kê Ta chọn mô hình Jukes - Cantor cho toán hìnhquả móng: Chỉ có mộttrình trường hợp nhất, liệu quan sát so 7.3 Với Cây Kết chương dóng cột Bảng Xét sinh loài có gốc với taxa, liệu tương ứng với gen có tên HIVenvSweden (dữ liệu lấy [Yang, z 1997 7) có chiều dài 273 ký tự sau: U68496:=GT AGT AATT AGATCTG AAAACTTC ACGAAC AAT GCT AAAACC AT AAT AGT AC AGCT AAAT AAAT CT GT AG AAATT AATT GT GT AAG ACCCGGC A AC AATCây ACnày AAGAAG AC AT AT AGG AGGG AG AGC AT ATT có lópAAGT tương AT đương, số lượng từngACC lóp trẽn liệu «=(247, 25, 1), chạy chương trình cho kết quả: AT AC A p= (0.903285626594, 0.094557322708, 0.00215705069738) GG AG AAGT AAT AGG AG AT AT AAG AC AAGC AC ATT GT AACCTT AGT giá trị hàm họp lý tương ứng l ( p ) = -90.22670674 AG AAC Với Cây hình lược: Có lóp xác suất tương đương trường họp xảy ra: AG ACT GG AAT AA AACTTT A AAAC AGGT AGCT G A A AAATT AAG AG Trưòns hov ỉ: Các nút tương ứng (V68496ẬJJ68496, Ư68496)) số AAC lượngAAT mẫu liệu quan sát so dóng cột trường họp hảng AC AAC AAT AGTCTTT AAT c AAT cc TT AAT 7:=GT AGT A ATT AG AT CT G A A A ACTTCT CG A ACAAT GC T AAAACC AT A AT AGTAC AGCT AAAT AAAT CTGT AG A AATT AATT GT AC AAG ACCC AAC AA c AAT AC AAG A AG AAGT AT AC ATTTT GG ACC AGGG AAAGC ATTTT AT GC AG G AG AAAT AAT AGG AG AT AT AAG AC AAGC AT ATT GT ACCCTT AATGG AAC A G AAT GG AAT AAC ACTTT AAAAC AGGT AGCT G AAAAATT AAG AG AAC Bùi BùiVăn VănĐồng Đồng Trang Trang54 55 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ Chương TỔNG KẾT - ĐÁNH GIÁ Chương tổng kết lại công việc làm được, sau nêu đóng góp hướng phát triển luận văn 8.1 Tổng kết Luận văn nghiên cứu đến lãnh vực nhiều người quan tâm giai đoạn Luận văn cho ta nhìn tổng thể sinh loài phương pháp để giải phương trình hợp lý, cách mô hình hóa toán chọn phương pháp giải toán Trong phương pháp chọn phương pháp đại số nói chung đại số máy tính nói riêng Ngoài ra, luận văn cung cấp gói phần mềm sử dụng kiểm nghiệm lý thuyết đưa Vì kiến thức thời gian có hạn nên luận văn có nhiều khiếm khuyết tương u = cô (247, 19, 6, 1), kết chạy chương trình:các mô nộiVector dung luậnliệu văn chưaứng đọng, phần chương trình kiểm nghiệm pđun =(0.9032484236332, 0.07179349581611, 0.0228400591792, 0.0021180213714) chưa tích họp phần lại với Hạn chế lớn phải kể đến chương giá trị hàm ỉ ( p ) = -104.0121158 trình chạy sinh loài taxa, trường hợp taxa chạy kết nhữngVới mô hình đơntrên giản.thì ta thấy với trường họp sinh loài thứ liệu đựợc gán cho với thứ tự ((Ư68498,(U68496, U68497)) “họp lý” Xét sinh loài giải thích tốt cho liệu sinh loài hình lược, có8.2 hàm họp lýNhững cho kết lớn đóng góp luận văn -Đối với thân qua luận văn thu thập kiến thức sinh học nói chung việc nghiên cứu tiến hoá nói riêng Cũng qua luận văn bổ sung cho kiến thức toán học, xác suất thống kê đại số máy tính - Luận văn tài liệu tham khảo ban đầu cho quan tâm đến lãnh vực tính toán thống kê sinh học phân tử, tiến hóa Ngoài tài liệu bổ ích cho nhìn tổng quan phương pháp ước lượng họp lý cực đại cách giải chúng phương pháp đại số Những lãnh vục đề cập luận văn Bùi Bùi Văn Văn Đồng Đồng Trang Trang56 57 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ 8.3 Hướng phát triển Với hạn chế nẽu trên, hướng phát triển luận văn đưa chủ yếu khắc phục nhược điểm để giải toán sinh loài lớn hơn: - Cải tiến thuật toán để chạy tốt - Song song hóa để giải toán ước lượng họp lý cực đại - Một hướng khác nên quan tâm nghiên cứu đặc tính cụ thể tập trung giải toán riêng biệt Bùi Văn Đồng Trang 58 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ TAI LIỆU THAM KHAO [Hoàng Xuân Sính, 2003] [Đào Hữu Hồ, 2002] [Tạ Lê Lợi, 2002] Hoàng Xuân Sinh Đại số đại cương Nhà xuất GD, 2003 [Benny Chor, 2005] Đào Hữu Hồ Xác suất thống kê Nhà xuất KHKT, 2002 Tạ Lê Lợi Giải Tích - Giáo trình cử nhân toán Đại học Đà Lạt, 2002 [B Chor, M Hendy, B Maximum likelihood Jukes-Cantor Triplets: Analytic Solutions arXiv: Holland, and D Penny, q-bio.PE/0505054 vl 27 May 2005 2000] Multiple maxima of likelihood in phylogenetic trees: An analytic [Catanese et al., 2005] approach MBE, 17(10): 1529—1541, 2000 Earlier version appeared in RECOMB 2000 F Catanese, [Evans and Speed,1993] [Hoẹten et al., 2005] s Ho sten, A Khetan, and B Sturmfels The maximum likelihood degree American Joumal of Mathematics, 2005 To appear Cited on p 10, 106 Steven N.Evans and Speed Invariants of some probability models used in phylogenetic iníerence The Annals of Statistics 1993, vol 21, No I, 355-377 Hoặten, A Khetan, and B Sturmíels Solving the likelihood equations Foundations of Computational Mathematics, 2005 To appear Cited on p 108, 335, 343, 344 J Milne Algebraic Geometry Taiaroa Publishing Erehvvon Version 5.00 February 20,2005 Lior Pachter and Bemd Sturmíels Algebraic Statistics for Computational Biology Cambridge University Press 2005 Luis David Garcia Small Phylogennetic Trees http://www.math.tamu.edu/~lgp/small-trees Melvyn B Nathanson Elementary Methods in Number Theory Springer, 1999 s [J.s Milne, 2005] [Lior Pachter and Bemd Sturmfels, 2005] [Luis D Garcia, 2006] [Melvyn B Nathanson,1999] [Nguyên V.M Man,2007] [Sturmíels and Sullivant, 2005] [Yang, z 1997] Bùi Văn Đồng s Nguyên V.M Man Computational Algebraic Statistics(CAS) http://www.cse.hcmut.edu.vn/~mnguyen/classes/CAS/indexCAS.html Bemd Sturmíels and Seth Sullivant Toric Ideals of Phylogenetic Invariants http://arxiv.org/abs/q-bio/0402015vl Ziheng Yang A program package for phylogenetic analysis by maximum likelihood Computer Applications in BioSciences 13:555556 http://abacus.gene.ucl.ac.uk/software/paml.html Trang 59 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ Phụ lục Tập xác suất trình bày chương PAAA=l/4*c0*c0*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A3+3/4*clA3, PAAG=l/4*c0*cl*c0+l/4*cl*c0*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PAAC=1/4*C0*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PAAT^l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*cl*c0*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PAGA=l/4*cl*c0*c0+l/4*c0*cl*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PAGG=l/4*cl*cl*c0+l/4*c0*c0*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PAGC=1/4*C1*C1*C0+1/4*C0*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=3/4*C0*C1A2+1/4*C1A3, PAGT^l/4*cl*cl*c0+l/4*c0*cl*cl+l/4*cl*cl*cl+l/4*cl*c0*cl=3/4*c0*cl A2+l/4*clA3, PACA=1/4*C1*C0*C0+1/4*C1*C1*C1+1/4*C0*C1*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PACG=1/4*C1*C1*C0+1/4*C1*C0*C1+1/4*C0*C1*C1+1/4*C1*C1*C1=3/4*C0*C1A2+1/4*C1A3, PACC=1/4*C1*C1*C0+1/4*C1*C1*C1+1/4*C0*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PACT=1/4*C1*C1*C0+1/4*C1*C1*C1+1/4*C0*C1*C1+1/4*C1*C0*C1=3/4*C0*C1A2+1/4*C1A3, PATA=l/4*cl*c0*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*c0*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PATG=l/4*cl*cl*c0+l/4*cl*c0*cl+l/4*cl*cl*cl+l/4*c0*cl*cl=3/4*c0*cl A2+l/4*clA3, PATC=1/4*C1*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C0*C1*C1=3/4*C0*C1A2+1/4*C1A3, PATT=l/4*cl*cl*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*c0*c0*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PGAA=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PGAG=l/4*c0*cl*c0+l/4*cl*c0*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PGAC=1/4*C1*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C0*C1*C1=3/4*C0*C1A2+1/4*C1A3, PGAT^l/4*cl*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*c0*cl*cl=3/4*c0*cl A2+l/4*clA3, PGGA=l/4*cl*c0*c0+l/4*c0*cl*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PGGG=l/4*c0*c0*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A3+3/4*clA3, PGGC=1/4*C0*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PGGT=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PGCA=1/4*C1*C1*C0+1/4*C1*C0*C1+1/4*C0*C1*C1+1/4*C1*C1*C1=3/4*C0*C1A2+1/4*C1A3, PGCG=1/4*C0*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PGCC=1/4*C1*C1*C0+1/4*C1*C1*C1+1/4*C0*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PGCT=1/4*C1*C1*C0+1/4*C1*C1*C1+1/4*C0*C1*C1+1/4*C1*C0*C1=3/4*C0*C1A2+1/4*C1A3, PGTA=l/4*cl*cl*c0+l/4*cl*c0*cl+l/4*c0*cl*cl+l/4*cl*cl*cl=3/4*c0*cl A2+l/4*clA3, PGTG=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PGTC=1/4*C1*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C0*C1*C1=3/4*C0*C1A2+1/4*C1A3, PGTT=l/4*cl*cl*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*c0*c0*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PcAA=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PcAG=l/4*cl*cl*c0+l/4*cl*c0*cl+l/4*c0*cl*cl+l/4*cl*cl*cl=3/4*c0*cl A2+l/4*clA3, PCAC=1/4*C0*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PcAT=l/4*cl*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*c0*cl*cl=3/4*c0*cl A2+l/4*clA3, Bùi Văn Đồng Trang 60 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ PcGA=l/4*cl*cl*c0+l/4*cl*c0*cl+l/4*c0*cl*cl+l/4*cl*cl*cl=3/4*c0*cl A2+l/4*clA3, PcGG=l/4*cl*cl*c0+l/4*c0*c0*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PCGC=1/4*C0*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PcGT=l/4*cl*cl*c0+l/4*c0*cl*cl+l/4*cl*cl*cl+l/4*cl*c0*cl=3/4*c0*cl A2+l/4*clA3, PccA=l/4*cl*c0*c0+l/4*cl*cl*cl+l/4*c0*cl*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PccG=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, Pccc=l/4*c0*c0*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A3+3/4*clA3, PccT=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PcrA=l/4*cl*cl*c0+l/4*cl*c0*cl+l/4*c0*cl*cl+l/4*cl*cl*cl=3/4*c0*cl A2+l/4*clA3, PcrG=l/4*cl*cl*c0+l/4*cl*c0*cl+l/4*cl*cl*cl+l/4*c0*cl*cl=3/4*c0*cl A2+l/4*clA3, Pcrc=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PcrT=l/4*cl*cl*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*c0*c0*cl=l/4c0 A2*cl+l/4*c0*clA2+l/2*clA3, PTAA=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PTAG=l/4*cl*cl*c0+l/4*cl*c0*cl+l/4*c0*cl*cl+l/4*cl*cl*cl=3/4*c0*cl A2+l/4*clA3, PTAC=1/4*C1*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C0*C1*C1=3/4*C0*C1A2+1/4*C1A3, PTAT=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*cl*c0*cl=l/4*c0 A2*cl+l/4*c0*clA2+l/2*clA3, PTGA=l/4*cl*cl*c0+l/4*cl*c0*cl+l/4*c0*cl*cl+l/4*cl*cl*cl=3/4*c0*cl A2+l/4*clA3, PTGG=l/4*cl*cl*c0+l/4*c0*c0*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PTGC=1/4*C1*C1*C0+1/4*C0*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=3/4*C0*C1A2+1/4*C1A3, PTGT=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0 A2*cl+l/4*c0*clA2+l/2*clA3, PTCA=1/4*C1*C1*C0+1/4*C1*C0*C1+1/4*C0*C1*C1+1/4*C1*C1*C1=3/4*C0*C1A2+1/4*C1A3, PTCG=1/4*C1*C1*C0+1/4*C1*C0*C1+1/4*C0*C1*C1+1/4*C1*C1*C1=3/4*C0*C1A2+1/4*C1A3, pTcc=l/4*cl*cl*c0+l/4*cl*cl*cl+l/4*c0*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PTCT=1/4*C0*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PTTA=l/4*cl*c0*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*c0*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PTTG=l/4*c0*cl*c0+l/4*cl*cl*cl+l/4*cl*c0*cl+l/4*cl*cl*cl=l/4*c0A2*cl+l/4*c0*clA2+l/2*clA3, PTTC=1/4*C0*C1*C0+1/4*C1*C1*C1+1/4*C1*C0*C1+1/4*C1*C1*C1=1/4*C0A2*C1+1/4*C0*C1A2+1/2*C1A3, PTTT=l/4*c0*c0*c0+l/4*cl*cl*cl+l/4*cl*cl*cl+l/4*cl*cl*cl=l/4*c0A3+3/4*clA3; Bùi Văn Đồng Trang 61 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng sinh loài nhỏ Phụ lục Tập liệu kết thực trình bày chương c = (n+1) - dim(V) = Q:= M = Ker( «7) [...]... đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ trong dự án nghiên cứu này chúng tôi hướng vào kỹ thuật đại số tính toán cho vấn đề ước lượng khả năng cực đại và áp dụng để tái cấu trúc cây sinh loài Xuất phát từ những thực tế trên, đề tài này đặt ra một số mục tiêu sau: > Tìm hiểu mô hình xác suất thống kê trên cây sinh loài Tìm hiểu phương pháp họp lý cực đại và áp dụng. .. giải quyết Bùi Văn Đồng Trang 28 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ trên những bài toán lớn Nhược điểm lớn nhất của phưong pháp này là tính tin cậy không cao Phương pháp tính toán đại số: Ngược lại với phương pháp gần đúng trên, phương pháp tính toán đại số hiện nay chỉ giải quyết được với những bài toán nhỏ, nhưng cho kết quả chính xác Với sự tiến... vực đại số máy tính nói riêng, đã mở ra con đường cho hướng tiếp cận này Vì lý do trên phương pháp này được chọn sử dụng để giải quyết bài toán ước lượng họp lý cực đại - áp dụng trên cây sinh loài nhỏ Để hiểu rõ cây sinh loài, ước lượng họp lý cực đại trên cây sinh loài chúng ta tìm hiểu sơ qua cây sinh loài và mô hình xác suất thống kê trên cây sinh loài ở chương sau Bùi Văn Đồng Trang 29 Phương pháp. .. dụ trên chúng ta nhận lại được các ước lượng điểm đã nêu Chúng ta sẽ phân tích kỹ về ước lượng họp lý cực đại với mẫu quan sát ở chương sau Bùi Vãn Đồng Trang 24 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ Chương 3 ƯỚC LƯỢNG HỢP LÝ cực ĐẠI TRÊN MẪU Chương này chúng ta tìm hiểu kỹ hơn về MLE trên mô hình thống kê Dần ra một vài ví dụ về ước lượng hợp lý cực. .. Trang 31 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ 4.3 Mô hình ước lượng hợp lý cực đại trên cây sinh loài Cho Sỉ, S2, SN là một dãy mẫu DNA mà chúng ta có Đe đon giản, giả thiết rằng mọi chuỗi trên có cùng chiều dài Chúng ta muốn xác định những tham số của một cây sinh loài thông qua dãy mẫu trên và làm cực đại khả năng có thể xảy ra Để giải bài toán này... Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ Chương 4 CÂY SINH LOÀI - MÔ HÌNH XÁC SUÁT THỐNG KÊ TRÊN CÂY SINH LOÀI Chương này giới thiệu cây sinh loài cũng mô hình xác suất thống kê trên cây sinh loài Ngoài ra cũng giới thiệu một số mô hình thường sử dụng hiện nay trẽn cây sinh loài như mô hình Neyman 2 trạng thái, Jukes - Cantor, Kimura với 2 và 3 tham số 4.1... timeline) dựa trên các hiểu biết hiện nay của khoa học Hình 3 cho ta thấy hình dạng của cây sinh loài sự sống trên hành tinh chúng ta Bacteria Archaea Eucaryota Green Bùi Văn Đồng Trang 30 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ 4.2 Các nghiên cứu phát sinh sinh loài Trong ngành sinh học, người ta nghiên cứu mối quan hệ giữa các loài sinh vật thông... quát hóa mô hình xác suất thống kê trên sinh loài Chỉ ra cấu trúc nhóm Aben đối với các mô hình sử dụng để từ đó tìm thành phần bất biến trên cây sinh loài Bùi Vãn Đồng Trang 11 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ Chương 2 cơ SỜ LÝ THUYẾT VÈ CÁC CẤU TRÚC ĐẠI SỐ VÀ XÁC SUẤT THỐNG KÊ Các khái niệm cơ bản của đại số được trình bày ở phần đầu của chương... dữ liệu đã cho x[2], - Bùi Vãn Đồng Trang 25 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ 3.1.3 Ví dụ về ước lượng hợp lý cực đại Chúng ta sẽ bắt đầu với từ một ví dụ đơn giản nhất là đánh giá sự thiên lệch khi tung một cây đinh bấm, sau đó đến những mô hình phức tạp hơn từ đó áp dụng MLE tới phỏng đoán cây sinh loài £ V 777) 7777777777777777 Head 7777777777777777... CHƯƠNG 2: CÁC CẤU TRÚC ĐẠI SỐ cơ BẢN - cơ SỞ LÝ THUYẾT VỀ XÁC SUẤT THỐNG KÊ Chuông này giới thiệu các khái niệm cơ bản của toán học đại số và xác suất thống kê được sử dụng vào các chương sau của đề tài Các khái niệm về các cấu trúc Bùi Vãn Đồng Trang 10 Phương pháp đại số cho hài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ CHƯƠNG 5: BẤT BIỂN TRÊN CÂY SINH LOÀI Trong chưong này, ... toỏn c lng hp lý cc i - ỏp dng trờn cõy sinh loi nh hiu rừ cõy sinh loi, c lng hp lý cc i trờn cõy sinh loi chỳng ta tỡm hiu s qua cõy sinh loi v mụ hỡnh xỏc sut thng kờ trờn cõy sinh loi chng... i s cho hi toỏn c lng hp lý cc i - p dng trờn cõy sinh loi nh Chng CY SINH LOI - Mễ HèNH XC SUT THNG Kấ TRấN CY SINH LOI Chng ny gii thiu cõy sinh loi cng mụ hỡnh xỏc sut thng kờ trờn cõy sinh. .. hỡnh húa bi toỏn trờn cõy sinh loi Bựi Vn ng Trang 31 Phng phỏp i s cho hi toỏn c lng hp lý cc i - p dng trờn cõy sinh loi nh 4.3 Mụ hỡnh c lng hp lý cc i trờn cõy sinh loi Cho S, S2, SN l mt dóy

Ngày đăng: 05/01/2016, 17:19

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan