Nghĩa kết quả thực nghiệm

Một phần của tài liệu Khám phá tương tác trội nhờ phương pháp tối ưu đàn kiến (Trang 63 - 66)

Dựa trên kết quả công bố và bộ dữ liệu của bài báo cung cấp, mục đích là thử nghiệm lại với chương trình chạy của thuật toán so sánh với quy tắc cập nhật mùi mới Max-Min trơn và xử lý song song, có phát hiện ra được các vị trí tương tác với nhau hay không. Bằng cách chạy với bộ dữ liệu mô phỏng của bài báo đã đưa ra.

Hiểu được ý nghĩa trong mỗ hình cũng như bảng của bài báo. Biết được đánh giá thuật toán như nào là tốt như nào là xấu để từ đó so với các thuật toán khác thuật toán AntEpiSeeker đưa ra có hiệu quả hơn các thuật toán khác như: Thuật toán BEAM, thuật toán SNPHarvester và thuật toán Generic ACO.

Ngoài ra thử nghiệm với xử lý song song để cải tiến thời gian của thuật toán, cài đặt thử nghiệm với quy tắc cập nhật mùi mới SMAAS so sánh với thuật toán của bài báo đưa ra và đã cho được kết quả tốt hơn dựa vào giá trị Pvalue.

KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN

KẾT LUẬN

Trong luận văn tôi thực hiện khảo cứu thuật toán AntEpiSeeker mà tác giả bài báo[22] đưa ra cho việc phát hiện các tương tác gen trong nghiên cứu về một bệnh chứng, áp dụng với bộ dữ liệu lớn. Đồng thời cũng giới thiệu một số khái niệm về di truyền cũng như tổng quan về thuật toán ACO, giới thiệu một số thuật toán ACO đã được nghiên cứu.

Thuật toán AntEpiSeeker thông qua một thủ tục tối ưu hóa, thực hiện hai giai đoạn: Giai đoạn đầu sử dụng thuật toán kiến, giai đoạn hai dùng thuật toán duyệt toàn bộ. Thuật toán AntEpiSeeker là thuật toán cải tiến của thuật toán Generic ACO chung. Thuật toán đưa ra các kết quả để chứng minh những ưu điểm của việc tối ưu hóa hai giai đoạn, so sánh khả năng phát hiện của AntEpiSeeker với các thuật toán khác.

Thuật toán AntEpiSeeker được đánh giá thông qua so sánh với ba phương pháp tiếp cận: Thuật toán BEAM, thuật toán SNPHarvester và thuật toán Generic ACO trên cả hai bộ dữ liệu mô phỏng và thực tế. Thông qua các kết quả đánh giá về: Hiệu năng của các thuật toán trên một bộ dữ liệu được mô phỏng, đánh giá tỉ lệ dương tính giả và đánh giá phần trăm phát hiện đúng và phát hiện sai trên bộ dữ liệu lớn mở rộng. Kết quả cho thấy nhìn chung thuật toán AntEpiSeeker tốt hơn so với các thuật toán khác.

HƢỚNG PHÁT TRIỂN

Từ thuật toán AntEpiSeeker chúng tôi đã bổ sung thêm xử lý song song để giảm thời gian tính toán mà thuật toán chưa có nhưng vẫn đảm bảo tính đúng đắn của thuật toán, đồng thời cũng cài đặt với quy tắc cập nhật mùi Max-Min trơn mới và tiến hành thực hiện so sánh với quy tắc cập nhật mùi của bài báo đưa ra. Kết quả so sánh dựa trên hai tiêu chí: So sánh về tốc độ và so sánh về độ chính xác dựa vào giá trị 𝑃 𝑣𝑎𝑙𝑢𝑒. Kết quả cho thấy, thời gian chạy của xử lý song song nhanh hơn gấp 1.5 lần so với thời gian chạy của thuật toán ban đầu và khả năng phát hiện đúng được đánh giá theo giá trị 𝑃 𝑣𝑎𝑙𝑢𝑒 cũng tốt hơn so với kết quả ra của bài báo.

Thuật toán AntEpiSeeker là một dự án nghiên cứu liên tục và có thể được nâng cấp trong tương lai về thời gian cũng như khả năng phát hiện ra các tương tác gen được nghi ngờ cao là có liên quan đến bệnh.

TÀI LIỆU THAM KHẢO Tiếng Việt

[1]Đỗ Đức Đông (2012), Phương pháp tối ưu đàn kiến và ứng dụng, Đại học Công nghệ- Đại học Quốc gia Hà Nội, luận án Tiến sĩ.

[2]Hoàng Trọng Phán, Trương Thị Bích Phượng, Trần Quốc Dung (2005), Giáo trình

di truyền học, Dự án Giáo dục Đại học- Đại học Huế.

Tiếng Anh

[3]W.Bateson (1909), “Mendel’s Principles of Heredity”, Cambridge University Press, Cambridge.

[4]YM. Cho, MD. Ritchie, JH. Moore, JY. Park, KU. Lee, HD. Shin, HK. Lee, KS. Park (2004), “Multifactor-dimensionality reduction shows a two-locus interaction associated with type 2 diabetes mellitus”, Diabetologia, 47:549-554.

[5]HJ. Cordell (2002), “ Epistasis: what it means, what it doesn't mean, and statistical methods to detect it in humans”, Hum Mol Genet, 11:2463-2468.

[6]D. Corne, M. Dorigo, F. Glover (1999), New Ideas in Optimization, McGraw-Hill. [7]M. Dorigo, G. Di Caro, LM. Gambardella (1999), “Ant Algorithms for Discrete

Optimization”, Artificial Life, 5:137-172.

[8]M. Dorigo, T.Stützle (2004), Ant Colony Optimization, The MIT Press, Cambridge, Masachusetts, 2004.

[9]M. Dorigo, L.M. Gambardella (1997), “Ant colony system: A cooperative learning approach to the traveling salesman problem”, IEEE Transon evolutionary computation, vol.1, no.1, 1997, pp. 53-66.

[10] M. Dorigo, L.M. Gambardella (1997), “Ant colonies for the travelling salesman problem”, Biosystems, 43:73-81.

[11] M. Dorigo, V. Maniezzo, A. Colorni (1991), “The Ant System: An autocatalytic optimizing process”, Technical Report 91-016 Revised, Dipartimento di Elettronica, Politecnico di Milano, Milano, Italy.

[12] RA. Fisher (1922), On the interpretation of χ2 from contingency tables, and the calculation of P, Journal of the Royal Statistical Society 1922; 85(1):87-94.

[13] S. Goss, S. Aron, J.L. Deneubourg, J.M. Pasteels (1989), “Self-organized shortcuts in the Argentine ant”, Naturwissenschaften, 76, 579–581.

[14] RJ. Klein, C. Zeiss, EY. Chew, JY. Tsai, RS. Sackler, C. Haynes, AK. Henning, JP. SanGiovanni, SM. Mane, ST. Mayne ST (2005), “Complement factor H polymorphism in age-related macular degeneration”, Science, 308:385-389.

[15] V. Maniezzo, A. Carbonaro (2000), “An ANTS heuristic for the frequency assignment problem”, Future Generation Computer Systems, 16:927-935.

[16] J. Marchini, P. Donnelly, LR. Cardon (2005), “Genome-wide strategies for detecting multiple loci that influence complex diseases”, Nat Genet, 37:413-417

[17] MD. Ritchie, LW. Hahn, N. Roodi N, LR. Bailey,WD. Dupont, FF. Parl, JH. Moore (2001), “Multifactor-dimensionality reduction reveals high-order interactions among estrogen metabolism genes in sporadic breast cancer”, Am J Hum Genet, 69:138-147.

[18] KR. Robbins, W. Zhang, JK. Bertrand, R. Rekaya (2007), “The ant colony algorithm for feature selection in high-dimension gene expression data for disease classification”, Math Med Bio, 24:413-26.

[19] T. Stützle, H. H. Hoos (2000), “Max-Min ant system”, Future Gene. Comput.

Syst, vol. 26, no.8, 2000, pp. 889-914.

[20] EG. Talbi, O. Roux, C. Fonlupt, D. Robillard (2001), “Parallel Ant Colonies for the quadratic assignment problem”, Future Generation Computer System, 17:441- 449.

[21] CT. Tsai, LP. Lai, JL. Lin, FT. Chiang, JJ. Hwang, MD. Ritchie, JH. Moore, KL. Hsu, CD.Tseng,CS. Liau, YZ.Tseng (2004), “Renin-angiotensin system gene polymorphisms and atrial fibrillation”, Circulation, 109:1640-1646.

[22] Y. Wang, X. Liu, K. Robbins, R. Rekaya (2010), “AntEpiSeeker: detecting epistatic interactions for case-control studies using a two-stage ant cology optimization algorithm”, BMC Research Notes, 3:117.

[23] C. Yang, Z. He, X. Wan, Q. Yang, H. Xue, W. Yu (2009), “SNPHarvester: a filtering-based approach for detecting epistatic interactions in genome-wide association studies”, Bioinformatics, 25:504-511.

[24] Y. Zhang, JS. Liu (2007), “Bayesian inference of epistatic interactions in case- control studies”, Nat Genet, 39:1167-1173.

Một số trang web [25] http://hoiyhoctphcm.org.vn/Data/pdf/1212Dunstan.pdf [26] http://vietsciences.free.fr/timhieu/khoahoc/ykhoa/ynghiacuatrisoP.htm [27] http://www.zsinhhoc.blogspot.com/2013/01/tuong-tac-at-che.html [28] http://math.hws.edu/javamath/ryan/ChiSquare.html [29] http://xacsuatthongkea.wikispaces.com/file/view/Chuong+6.pdf [30] http://timmachhoc.vn/y-hoc-thuc-chung/297-y-hc-thc-chng-sanofi.html [31] http://tudu.com.vn/vn/y-hoc-thuong-thuc/diem-bao/tac-dong-gen-de-tri-benh- huong-di-moi-trong-tuong-lai/

Một phần của tài liệu Khám phá tương tác trội nhờ phương pháp tối ưu đàn kiến (Trang 63 - 66)

Tải bản đầy đủ (PDF)

(66 trang)