Thuật toán xác định cha chung gần nhất của hai nút trong cây ứng dụng phân tích đa dạng loại vi sinh vật

85 191 0
Thuật toán xác định cha chung gần nhất của hai nút trong cây ứng dụng phân tích đa dạng loại vi sinh vật

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG NINH QUANG TRUNG THUẬT TOÁN XÁC ĐỊNH CHA CHUNG GẦN NHẤT CỦA HAI NÚT TRONG CÂY ỨNG DỤNG PHÂN TÍCH ĐA DẠNG LOÀI VI SINH VẬT Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Ngun, năm 2014 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG NINH QUANG TRUNG CÁC PHƢƠNG PHÁP XÁC ĐỊNH CHA CHUNG GẦN NHẤT CỦA HAI NÚT TRONG CÂY, ỨNG DỤNG PHÂN TÍCH ĐA DẠNG LỒI VI SINH VẬT Chun ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: TS Nguyễn Cƣờng LỜI CAM ĐOAN Tôi xin cam đoan: Luận văn cơng trình nghiên cứu thực cá nhân, đƣợc thực dƣới hƣớng dẫn khoa học Tiến sĩ Nguyễn Cường Các số liệu, kết luận nghiên cứu đƣợc trình bày luận văn trung thực chƣa đƣợc công bố dƣới hình thức Tơi xin chịu trách nhiệm nghiên cứu Học viên Ninh Quang Trung LỜI CẢM ƠN Lời đầu tiên, xin chân thành cảm ơn Tiến sĩ Nguyễn Cường ngƣời trực tiếp huớng dẫn tơi hồn thành luận văn Với lời dẫn, tài liệu, tận tình hƣớng dẫn lời động viên Thầy giúp tơi vƣợt qua nhiều khó khăn q trình thực luận văn Tơi xin cảm ơn q Thầy (Cơ) giảng dạy chƣơng trình cao học “Khoa học máy tính” truyền dạy kiến thức quý báu, kiến thức hữu ích giúp nhiều thực nghiên cứu Xin cảm ơn quý Thầy (Cô) công tác Trƣờng Đại học Công nghệ thông tin truyền thông – Đại học Thái Nguyên tạo điều kiện cho đƣợc tham gia hồn thành khóa học Tơi xin chân thành cảm ơn Học viên Ninh Quang Trung 55 MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN iv MỤC LỤC v DANH MỤC CÁC HÌNH ẢNH vii DANH MỤC CÁC BẢNG BIỂU viii DANH MỤC CÁC TỪ VIẾT TẮT-THUẬT NGỮ ix MỞ ĐẦU CHƢƠNG I: LÝ THUYẾT ĐỒ THỊ VÀ CÂY 1.1 Các khái niệm đồ thị 1.1.1 Định nghĩa đồ thị (Graph) 1.1.2 Các khái niệm 1.1.3 Các thuật toán tìm kiếm đồ thị 1.1.4 Độ phức tạp tính tốn BFS DFS 15 1.2 Các khái niệm đồ thị 15 1.2.1Định nghĩa tính chất bản: 15 1.2.2 Một số khái niệm 16 CHƢƠNG II: CÁC PHƢƠNG PHÁP XÁC ĐỊNH CHA CHUNG GẦN NHẤT CỦA HAI NÚT TRONG CÂY 17 2.1 Giới thiệu toán LCA 17 2.2 Mối quan hệ LCA RMQ 19 2.3 Các phƣơng pháp tiếp cận 42 2.3.1 Bài toán hà tiện 43 2.3.2 Một số phƣơng pháp giải toán LCA 45 2.4 Lựa chọn phƣơng án cài đặt thuật toán cho toán LCA 515 CHƢƠNG III: KẾT QUẢ CÀI ĐẶT VÀ ĐÁNH GIÁ 54 3.1 Cây phân loài ứng dụng tốn phân tích đa dạng lồi vi sinh 66 vật 548 77 3.2 Cài đặt phần mềm 59 3.3 Đánh giá chất lƣợng liệu trình tự 63 3.4 Lắp ráp trình tự 65 3.5 Dự đoán gen 66 3.6 Phân tích đa dạng lồi vi sinh 67 KẾT LUẬN 70 TÀI LIỆU THAM KHẢO 67 viii DANH MỤC CÁC HÌNH ẢNH Hình 1.1: Ví dụ mơ hình đồ thị Hình 1.2: Ví dụ phân loại đồ thị Hình 1.3 Ví dụ thuật tốn tìm kiếm DFS Hình 1.4 Xác định đỉnh kề thuật tốn DFS 11 Hình 1.5 Đƣờng A kết thúc G 12 Hình 1.6 Bắt đầu từ A nhƣng theo trình tự tập cạnh thăm 12 Hình 1.7 Duyệt đỉnh 13 Hình 1.8 Ví dụ thuật tốn tm kiếm theo chiều sâu 14 Hình 1.9 Cây đồ thị 16 Hình 2.1 Vị trí phần tử tốn RQM 19 Hình 2.2 Ví dụ tốn RQM 21 Hình 2.3: Cấu trúc phân đoạn 23 Hình 2.4 Hình thuật tốn LCA 29 Hình 2.5 Phân chia đoạn toán LCA 30 Hình 2.6 Chuyển từ tốn LCA toán RQM 35 Hình 2.8 Ví dụ đƣa vài tốn từ RQM tốn LCA 37 Hình 2.9 Cây tiến hóa 43 Hình 3.1 Quy trình phân tích xử lý liệu 55 Hình 3.2 Chất lƣợng tính theo vị trí trình tự 59 Hình 3.3 Chất lƣợng theo đoạn trình tự 60 Hình 3.4 Cây phân lồi 63 Hình 3.5 Biểu đồ thể đa dạng sinh vật mẫu liệu 63 Hình 3.6 Số lƣợng đoạn ORF có liên quan đến quy trình chyển hóa 65 viii DANH MỤC CÁC BẢNG BIỂU Bảng 1.1 Bảng lập lịch duyệt đỉnh 14 Bảng 3.1 Kết lắp ráp trình tự 61 Bảng 3.2 Tổng quan kết dự đoán gen 61 Bảng 3.4 Đa dạng loài đƣợc đinh tên theo cấp độ khác 64 Bảng 3.5 Kết phân loại theo sở liệu KEGG 64 99 DANH MỤC CÁC TỪ VIẾT TẮT-THUẬT NGỮ Cụm từ viết tắt Cụm từ chi tiết ASCII American Standard Code for Informaton Interchange BFS Breadth First Search Bp Basepair DFS Depth – First – Search DNA Deoxyribo Nucleic Acid E Edges G Graph GA Genome Analyzer HGP Human Genome Project LCA Lowest Common Ancestor MEGAN MetaGenomeANalyzer MGA MetaGeneAnnotator NCBI National Center for Biotechnology Information NGS Next Genration Sequencing PCR Polymerase chain reaction RMQ Range-Minimum Query CHƢƠNG III: KẾT QUẢCÀI ĐẶT VÀ ĐÁNH GIÁ 3.1 Cây phân loài ứng dụng tốn phân tích đa dạng lồi vi sinh vật Cây phát sinh chủng loại (tiếng Anh: phylogenic tree) miêu tả lịch sử tến hóa nhóm loài (species) với đặc điểm sinh thái khác nhƣng có mối quan hệ họ hàng với hình thành từ tổ tiên chung khứ Do đó, cách biểu diễn tốt cho tến hóa sử dụng đồ thị dạng Và toán đƣợc quan tâm năm gần đánh giá đa dạng loài quần thể vi sinh vật dựa nguyên tắc tìm kiếm tổ tiên (nút cha) chung phân loài cho trƣớc loài vi sinh vật đƣợc tm thấy Đây tốn Least Common Ancestor (LCA) lý thuyết đồ thị Kết chƣơng trình đƣợc áp dụng tập liệu thực tế thu đƣợc từ dự án phân tích đa dạng loài hệ vi sinh vật ruột mối Bộ liệu trình tự hệ gen hệ vi sinh vật có kích thƣớc 3.2 tỷ basepair (tƣơng đƣơng 32 tỷ ký tự) thu đƣợc từ thiết bị đọc trình tự hệ Tồn liệu trình tự đƣợc xử lý với quy trình phân tích nhƣ sau: Đánh giá tnh liệu trình tự thu đƣợc từ thiết bị đọc trình tự Lắp ráp trình tự để đƣợc đoạn trình tự dài gọi contigs Dự đoán cấu trúc gen từ contigs thu đƣợc Phân tích đa dạng lồi vi sinh vật dựa thuật tốn LCA đƣợc trình bày Quy trình phân tích xử lý liệu đƣợc thể qua sơ đồ sau: Dữ liệu Lắp ráp • Đánh giá chất lƣợng liệu • Phần mềm: FastQC • Lắp ráp trình tự • Phần mềm: SOAPdenovo Dự đốn • Dự đốn đoạn ORF có data • Phần mềm: MetageneAnotator Blast • So sánh với liệu NCBI • Phần mềm: Blast ++ Phân tích • Đánh giá đa dạng lồi • Phần mềm: LCA Megan Hình 3.1 Quy trình phân tích xử lý liệu 3.2 Cài đặt phần mềm Tất phần mềm đƣợc cài đặt ứng dụng hệ điều hành Ubuntu phiên 14.04 64 bit Tất phần mềm đƣợc cài đặt máy chủ tính toán hiệu cao (Chip Xeon 24 lõi, 198GB RAM, 4TB HDD) đặc thù liệu lớn (dữ liệu phân tích thực tế lên tới hàng TeraByte) Đánh giá chất lƣợng liệu với FasQC FastQC phần mềm tốt dành cho việc đánh giá chất lƣợng liệu từ thiết bị đọc trình tự hệ FastQC đánh giá chất lƣợng dựa 11 têu chí khác nhƣ là: Chất lƣợng theo base, chất lƣợng theo trình tự, phân bố độ dài trình tự, tỉ lệ % A, T, G, C, tần suất xuất K-mer… FastQC u cầu mơi trƣờng Java Vì để sử dụng đƣợc phần mềm ngƣời dùng cần cài đặt JRE JDK cho hệ điều hành trƣớc sử dụng cơng cụ Có thể tải FastQC từ địa chỉ: http://www.bioinformatcs.babraham.ac.uk/projects/fastqc/fastqc_v0.10.1 _ source.zip Sau giải nén cấp quyền chmod cho file thực thi fasqc lệnh: chmod 755 fastqc FastQC cung cấp giao diện đồ họa với tiêu chí đánh giá chất lƣợng liệu khác Để chạy giao diện, thƣ mục chứa file thực thi, sử dụng lệnh /fasqc Ngoài ra, ngƣời dùng chạy lệnh (command line)nhƣ sau: /fastqc input_file [opton] Với input_file tập liệu *.fastq đầu vào Option tùy chọn nâng cao chƣơng trình a Lắp ráp trình tự với SOAPdenovo SOAPdenovo phần mềm lắp ráp trình tự Viện nghiên cứu hệ gen Bắc Kinh phát triển có ƣu điểm thời gian lắp ráp ngắn, độ xác cao, nhiên nhu cầu sử dụng RAM lại lớn, thƣờng dung lƣợng RAM gấp đến 10 lần dung lƣợng liệu cần xử lý tùy vào độ phức tạp liệu Tải mã nguồn công cụ từ trang chủ: http://sourceforge.net/projects/soapdenovo2/files/SOAPdenovo2/ Sau giải nén cần biên dịch mã nguồn chƣơng trình thành file thực thi Tại thƣ mục SOAPdenovo, sử dụng lệnh make b Dự đốn gene với MGA MGA hai cơng cụ dự đoán prokaryote gen tốt MGA sử dụng thuật toán ab initio để dự đoán Khơng nhƣ gen tế bào nhân thực có cấu trúc phức tạp gen thuộc loài nhân sơ có cấu trúc đơn giản nhiều, có START/STOP codon trình tự mã hóa protein Do đó, phần mềm dự đốn gen theo phƣơng pháp ab inito thƣờng cho kết với độ xác cao Tải công cụ từ trang chủ: http://metagene.cb.k.u-tokyo.ac.jp/metagene/download_mga.html /mga input_file [opton] Trong đó: input_file: liệu đầu vào định dang fasta Option -m: nhiều loài, -s: đơn loài Trong thí nghiệm phân tích đa dang lồi nên sử dụng phần mềm mga với lựa chọn -m c BLAST – Đối sánh với ngân hàng gen giới BLAST công cụ phổ biến đƣợc dùng nhiều lĩnh vực Tin sinh học, công cụ đƣợc nhà sinh học sử dụng để truy vấn liệu từ ngân hàng gen giới có mặt hầu hết quy trình xử lý tn sinh học BLAST đƣợc Trung tâm Công nghệ sinh học Hoa kỳ NCBI phát triển với Ngân hàng gen GenBank Do nhu cầu sử dụng GenBank BLAST lớn, máy chủ NCBI thƣờng xuyên tải nên NCBI thiết kế cho download cài đặt phiên để sử dụng việc cập nhật liệu dễ dàng BLAST sử dụng thuật tốn gióng cột để tm đoạn tƣơng đồng trình tự đầu vào (query sequence) với hàng tỷ tỷ trình tự có GenBank, đánh giá mức độ tƣơng đồng độ tin cậy Tải công cụ từ địa chỉ: ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST / Tham số cụ thể nhƣ sau: blastx -db database -query input.fasta -gapopen 11 -gapextend 11 -evalue 10.e-10 -max_target_seqs 50 -outfmt -out blast-ncbi-output.xml Trong đó: Blastx: Với lựa chọn đƣa vào DNA truy vấn, chƣơng trình trả protein gần giống từ sở liệu Database: sở liệu sử dụng phép so sánh Cụ thể nghiên cứu sử dụng cở sở liệu NR Input.fasta : chuỗi trình tự truy vấn (dữ liệu đầu vào định dang fasta) Max_target_seqs : số lƣợng kết tối đa với trình tự truy vấn, thí nghiệm chúng tơi sử dụng 50 Outfmt : định dạng file kết quả, thí nghiệm chúng tơi sử dụng dịnh dang liệu đầu *.xml (outfmt=5) Tải sở liệu từ trang chủ: ftp://ftp.ncbi.nlm.nih.gov/blast/db/ d MEGAN Tải chƣơng trình từ địa http://ab.inf.unituebingen.de/data/software/megan5/download/welcome.h t ml 3.3 Đánh giá chất lƣợng liệu trình tự Để đánh giá liệu ban đầu sử dụng phần mềm FastQC Đây công cụ mạnh cho phép ngƣời dùng đánh giá chất lƣợng liệu chứa file Fastqc têu chí đánh giá khác nhau.Trong có hai tiêu chí Chất lƣợng theo vị trí trình tự chất lƣợng trung bình trình tự đáng quan tâm Chất lƣợng theo vị trí trình tựlà đánh giá chất lƣợng tất đoạn trình tự dựa chất lƣợng vị trí trình tự tƣơng ứng, vạch màu vàng tƣơng ứng với chất lƣợng tất trình tự vị trí trình tự tƣơng ứng Hình 3.1 cho thấy khoảng 80bp đầu đoạn trình tự hai tập liệu có chất lƣợng tốt (q > 28) có khoảng 20bp cuối đoạn trình tự có chất lƣợng chƣa tốt (q < 28).Tuy nhiên, liệu hoàn toàn phù hợp cho bƣớc xử lý Tập liệu Tập liệu Hình 3.2Chất lượng tính theo vị trí trình tự Chất lƣợng theo đoạn trình tự điểm chất lƣợng trung bình tất trình tự nằm đoạn trình tự Từ Hình 3.2 cho thấy hai tập liệu có triệu đoạn trình tự có chất lƣợng 35 (q=35) gần triệu đoạn trình tự tập liệu có chất lƣợng nhỏ 28 Tập liệu Tập liệu Hình 3.3Chất lượng theo đoạn trình tự Từ kết cho thấy chất lƣợng đầu vào có chất lƣợng tốt, có số trình từ hay đoạn trình tự có chất lƣợng chƣa đƣợc tốt, nhƣng số lƣợng khơng nhiều Vì liệu đạt chất lƣợng để thực bƣớc lắp ráp trình tự 3.4 Lắp ráp trình tự Trong thí nghiệm liệu DNA metagenome đƣợc lắp ráp phần mềm SOAPdenovo Số lƣợng contig thu đƣợc 8.512với tổng kích thƣớc 28.160.201bp Với contgs(đoạn trình tự dài đƣợc ghép từ đoạn trình tự ngắn)có chiều dài lớn 12.896bp, contgs có chiều dài nhỏ 500 bp (chiều dài tối thiểu) Kết chi tiết đƣợc trình bày Bảng 3.1 Bảng 3.1 Kết lắp ráp trình tự Tổng số Tổng chiều dài Contig dài Contig ngắn contig contig (bp) (bp) (bp) 8.512 28.160.201 12.896 500 3.5 Dự đoán gen Bảng 3.2 Tổng quan kết dự đoán gen ORF Số ORF ORF ORF thiếu đầu thiếu đầu 3’ 5’ 10.478 9.997 10.209 6.442 28,08% 26,80% 27,36% 18,00% hoàn chỉnh 37.309 ORF thiếu hai Với contig thu đƣợc, phần mềm MGA (MetaGeneAnnotator) dự đoán khung đọc mở (ORF) dự đoán 37.582 ORF với tổng chiều dài lên tới 19.529.920bp Trong số đó, số lƣợng ORF hồn chỉnh 10.478 (chiếm 27,88%); số ORF hai đầu 3’ 5’ 93.883 (chiếm 71,63%) Độ bao phủ gen đạt 69,4% Kết chi tiết đƣợc chỉnh bày bảng 3.2 bảng 3.3 Bảng 3.3 Thống kê chi tiết loại ORF Tổng độ dài ORF Độ dài ORF dài Độ dài ORF ngắn (bp) (bp) (bp) Hoàn chỉnh 5.022.105 4896 906 Thiếu đầu 3’ 4.632.110 3297 831 Thiếu đầu 5’ 5.036.406 7049 809 Thiếu hai 4.839.299 5289 694 Loại ORF 3.6 Phân tích đa dạng lồi vi sinh vật Bằng cơng cụ BLAST, ORF đƣợc so sánh với liệu NR (NonRedundance Database) để phân tích độ đa dạng lồi.Việc giải lồi (trên thƣ viện NR) đƣợc tính theo số đoạn ORF liệu mẫu đƣợc tm thấy cở sở liệu NR “chƣa biết”có nghĩa ORF khơng tƣơng đồng trình tự phân loại sở liệu; “đã phân loại” ORF tƣơng đồng với trình tự đƣợc phân loại ngành dƣới ngành sở liệu Kết sau chạy Blast tập liệu định dạng xml, có chứa thơng tin định danh lồi ORF, tập liệu đƣợc phân tích chƣơng trình xây dựng phân dựa thuật tốn (LCA - Lowest Common Ancestor) so sánh kết với nhiều sở liệu khác Trong thí nghiệm sử dụng kết blast để xây dựng phân loài so sánh với sở liệu KEGG (Kyoto Encyclopedia of Genes and Genomes)để phân loại gen vào đƣờng chuyển hóa khác Kết phân loại cho thấy, tổng số 37.309 đoạn ORF có 24.798 đoạn ORF đƣợc phân loại chiếm 66,5%, số đoạn ORF chƣa nhận biết đƣợc 12.511 chiếm 33,5% Cây phân loài đƣợc dựng hình 3.4 Hình 3.4Cây phân lồi Từ phân loại (Hình 3.4) biểu đồ dạng sinh vật (Hình 3.5), cho thấy chủ yếu đoạn ORF thuộc vào giới vi khuẩn (Bacteria), có phần nhỏ đƣợc phân vào giới sinh vật nhân chuẩn (Archaea) Hình 3.5Biểu đồ thể đa dạng sinh vật mẫu liệu Bảng 3.4 Đa dạng loài đƣợc đinh tên theo cấp độ khác Nhóm sinh vật Ngành Lớp Bộ Họ Chi Loài Bacteria 14 28 54 82 94 51 Archaea 1 Tổng 15 29 55 82 94 51 Từ bảng 3.4 mẫu liệu có 14 ngành thuộc vi khuẩn ngành thuộc vi khuẩn cổ (Archaea), có 28 lớp thuộc vào vi khuẩn có lớp thuộc vào ngành vi khuẩn cổ Ở mức độ phân loài có vi khuẩn, có 54 bộ, 82 họ, 94 chi 51 loài đƣợc định danh thuộc vào vi khuẩn Điều chứng tỏ mẫu liệu sinh vật thuộc ngành vi khuẩn có độ đa dạng cao Kết so sánh với sở liệu KEGG KEGG cở sở liệu chứa thông tin đƣờng chuyển hóa, phần mềm MEGAN có lựa chọn cho ngƣời dùng so sánh kết blast với ngân hàng liệu Kết đƣợc trình bày chi tết Bảng 3.5 Bảng 3.5 Kết phân loại theo sở liệu KEGG Con Số đƣờng ORF chuyển hóa 7.094 4.412 Xử lý Xử lý thông thông tin tin môi di truyền trƣờng 1.151 917 Chu kỳ Hệ thống tế bào thể 365 78 Bệnh ngƣời 171 Từ Bảng 3.5 cho thấy tổng số 37.309 đoạn ORF mẫu liệu có 7.094 đoạn ORF đƣợc phân vào (assign) vào sở liệu KEGG có 4.412 đoạn ORF có chức đƣờng chuyển hóa chiếm (69,2%), có 1.151 đoạn ORF có xử lý thông tn di truyền chiếm (16,22%), xử lý thông tn mơi trƣờng có 917 ORF chiếm (12,93%), có 365 (5,15%) đoạn ORF có chức liên quan đến chu kỳ tế bào Số đoạn ORF có liên quan đến bệnh ngƣời 171 chiếm 2,41% Hình 3.6 Số lượng đoạn ORF có liên quan đến quy trình chyển hóa KẾT LUẬN Đề tài cơng trình nghiên cứu đa dạng vi sinh vật ứng dụng công nghệ giải trình tự hệ cơng cụ tn sinh học Với kết thu đƣợc q trình thực đề tài, tơi xin đƣa số kết luận sau: Nắm bắt đƣợc khái niệm lý thuyết đồ thị, thuật tốn tm kiếm đồ thị Tìm hiểu đƣợc khái niệm đồ thị ứng dụng lý thuyết đồ thị liên hệ phân lồi để phân tích đa dạng lồi vi sinh Ứng dung lí thuyết đồ thị tm hiểu thuật toán xác định cha chung gần hai nút ứng dụng phân tích đa dạng lồi vi sinh Hiểu đƣợc quy trình phân tích đa dạng hệ gen vi sinh ứng dụng cơng nghê giải trình tự hệ mới, nắm bắt đƣợc nguyên lý cách sử dụng công cụ quy trình nhƣ (FastQC, SOAPdenovo, MGA, BLAST MEGAN5) Kết cho thấy sau lắp ráp trình tự thu đƣợc 8.512 contigs, dự đốn đƣợc 37 nghìn đoạn ORF, tm đƣợc liệu mẫu có khoảng 51 loại vi khuẩn đƣợc định danh đến mức độ lồi Từ kết khẳng định vi khuẩn có độ đa dạng lồi cao quần thể vi sinh vật có mẫu Ngồi tìm hiểu thêm sở liệu q trình chuyển hóa (KEGG) Kết có khoảng 10 nghìn đoạn ORF liệu mẫu có chức liên quan đến q trình chuyển hóa TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] Nguyễn Cam, Chu Đức Khánh, Lý thuyết Đồ thị, 1998 [2] Trần Quốc Chiến, Thuật toán hoán chuyển nguồn đích tm luồng cực đại (1), Tạp chí Khoa học & Công nghệ, Đại học Đà Nẵng, 1(13)/2006, 53-58 [3] Trần Quốc Chiến (2005), Giáo trình Lý thuyết đồ thị, Đại học Đà Nẵng 2005 [4] Nguyễn Tô Thành, Nguyễn Đức Nghĩa (1994), Giáo trình Tốn rời rạc, Trƣờng Đại học Bách khoa Hà Nội Tài liệu tiếng Anh [5] Cecchini, D A., E Laville, et al (2013) "Functional metagenomics reveals novel pathways of prebiotc breakdown by human gut bacteria." PloS one8(9): e72766 [6] Tang, Y., A Underwood, et al (2013) "Metaproteomics analysis reveals the adaptation process for the chicken gut microbiota." Applied and environmental microbiology [7] Jiang, L., M Lin, et al (2013) "Identification and characterization of a novel trehalose synthase gene derived from saline-alkali soil metagenomes." PloS one8(10): e77437 [8] Wang, L., A Hatem, et al (2013) "Metagenomic insights into the carbohydrate-active enzymes carried by the microorganisms adhering to solid digesta in the rumen of cows." PloS one8(11): e78507 Tài liệu Internet [9] http://www.cs.hope.edu/algamin/cc [10] http://www.csharp-station.com/Tutorial.aspx [11] http://msdn.microsoft.com/en-us/library/aa288436(v=vs.71).aspx [12] http://www.bmb.msu.edu/faculty/hegg/fulltextHegg.html [13] The European Bioinformatcs Institute, http://www.ebi.ac.uk/ [14] NCBI Blast Home, http://blast.ncbi.nlm.nih.gov/Blast.cgiwe ... sát thuật tốn cài đặt đƣợc máy tính số ứng dụng Trong khn khổ luận văn học vi n ứng dụng lý thuyết đồ thị để giải toán xác định cha chung gần hai nút nhằm mục đích phân tích đa dạng lồi vi sinh. .. vấn đề với định hƣớng giáo vi n hƣớng dẫn, chọn đề tài “Các phương pháp xác định cha chung gần hai nút cây, ứng dụng phân tích đa dạng loài vi sinh vật Đề tài xây dựng quy tnh phân tích liệu... TIN & TRUYỀN THÔNG NINH QUANG TRUNG CÁC PHƢƠNG PHÁP XÁC ĐỊNH CHA CHUNG GẦN NHẤT CỦA HAI NÚT TRONG CÂY, ỨNG DỤNG PHÂN TÍCH ĐA DẠNG LỒI VI SINH VẬT Chun ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN

Ngày đăng: 23/01/2019, 00:44

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan