Phân tích trình tự trong tin sinh học và ứng dụng trên cơ sở dữ liệu genome tôm sú

72 209 0
Phân tích trình tự trong tin sinh học và ứng dụng trên cơ sở dữ liệu genome tôm sú

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THƠNG TIN TRUYỀN THƠNG VŨ ĐÌNH GIANG PHÂN TÍCH TRÌNH TỰ TRONG TIN SINH HỌC ỨNG DỤNG TRÊN SỞ DỮ LIỆU GENOME TÔM CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ : 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS Nguyễn Long Giang Thái Nguyên - 2014 MỤC LỤC MỤC LỤC Danh mục thuật ngữ Danh sách bảng Danh sách hình vẽ MỞ ĐẦU MỞ ĐẦU Chương CÁC KHÁI NIỆM BẢN 1.1 Các khái niệm sinh học phân tử 1.2 Các toán tin sinh học 12 1.3 Các ứng dụng tin sinh học 13 1.4 Một số sở liệu sinh học lớn giới 14 Chương BÀI TỐN PHÂN TÍCH MỐI QUAN HỆ GIỮA CÁC TRÌNH TỰ 19 2.1 Bài tốn phân tích mối quan hệ hai trình tự 19 2.1.1 Giới thiệu toán 19 2.1.2 Phương pháp giải toán .20 2.1.3 Thuật toán Needleman-Wunsch .23 2.2 Bài toán phân tích mối quan hệ cục hai trình tự 26 2.1.4 Giới thiệu toán 26 2.1.5 Thuật tốn phân tích mối quan hệ cục hai trình tự .27 2.3 Tìm kiếm trình tự tương đồng BLAST 31 2.3.1 Giới thiệu toán 31 2.3.2 Thuật toán BLAST 31 2.4 Bài tốn phân tích mối quan hệ đa trình tự 34 2.4.1 Giới thiệu toán 34 2.4.2 Thuật toán quy hoạch động 36 2.4.3 Thuật tốn ngơi 39 2.4.4 Thuật toán hàng lũy tiến 42 Chương XÂY DỰNG CSDL HỆ GIEN TƠM TÍCH HỢP CÔNG CỤ BLAST 48 3.1 Kiến trúc hệ thống 48 3.2 Thiết kế sở liệu 49 3.2.1 Nguồn số liệu đầu vào .49 3.2.2 Thiết kế sở liệu 49 3.3 Thiết kế chức hệ thống 53 3.3.1 Mơ hình phân cấp chức 53 3.3.2 Mơ hình luồng liệu .55 3.3.3 Đặc tả chi tiết số chức 57 3.4 Một số giao diện chương trình 64 3.4.1 Giao diện trang chủ 64 3.4.2 Nạp liệu từ tệp XML 64 3.4.3 Nhập liệu trình tự Protein, Nucleotide, EST 64 3.4.4 Tra cứu thông tin 66 3.4.5 Tìm kiếm chuỗi tương đồng BLAST 67 KẾT LUẬN 68 Tài liệu tham khảo 69 Danh mục thuật ngữ Thuật ngữ tiếng Anh Thuật ngữ tiếng Việt Bioinformatics Tin sinh học Molecular biology Sinh học phân tử Nucleic acid Axít nuclêic DNA AND RNA ARN Nucleotide Nuclêơtít Protein Prơtêin Amino Acid Axít amin Gene Gien Genome Hệ gien Cromosome Nhiễm sắc thể Sequence Trình tự Pairwise alignment Sắp hàng trình tự Danh sách bảng Bảng 1.1 Tên đầy đủ, tên viết tắt loại nuclêơtít: Bảng 1.2 Tên đầy đủ, tên viết tắt loại nuclêơtít 11 Bảng 2.1 Hai trình tự AND X Y 19 Bảng 2.2 Hai trình tự sau hàng 20 Bảng 2.3 Các cách hàng khác hai trình tự X Y 21 Bảng 2.4 Ma trận điểm nuclêơtít 22 Bảng 2.5 Các cách hàng khác với tổng điểm khác 23 Bảng 2.6 Bảng F thuật toán quy hoạch động hai trình tự ADN 25 Bảng 2.7 Sắp hàng hai trình tự X Y với tổng điểm lớn 26 Bảng 2.8 Ma trận quy hoạch động F toán hàng cục hai trình tự AND X Y 30 Bảng 2.9 Sắp hàng cục hai trình tự X Y 30 Bảng 2.10 Minh họa ý tưởng thuật toán BLAST 32 Bảng 2.11 Ba bắt cặp XY, XZ, YZ tương thích với kết hợp thành hàng trình tự 36 Bảng 2.12 Ba bắt cặp XY, XZ, YZ khơng tương thích với để kết hợp thành hàng trình tự 36 Bảng 2.13 Sắp hàng tối ứu ba trình tự X, Y, Z 39 Danh sách hình vẽ Hình 1.1 Minh họa cấu trúc Axit amin 10 Hình 1.2 Trung tâm thơng tin cơng nghệ sinh học Hoa Kỳ 15 Hình 1.3 Cấu trúc NCBI 16 Hình 2.1 Sắp hàng lũy tiến với trình tự 43 Hình 3.1 Kiến trúc hệ thống CSDL hệ gien tôm 49 Hình 3.2 Mơ hình CSDL hệ gien tơm 50 MỞ ĐẦU Tin sinh học (bioinformatics) lĩnh vực khoa học sử dụng công nghệ ngành tin học, toán học ứng dụng, thống kê khoa học máy tính để giải toán sinh học Tin sinh học bao gồm việc xây dựng, quản lý lưu trữ nguồn liệu quy mơ tồn cầu liên quan đến sinh học, xây dựng hồn thiện chương trình máy tính xử lý liệu, cơng cụ hỗ trợ hiệu cho việc nghiên cứu, khám phá chất sinh học giới tự nhiên sản xuất sản phẩm sinh học mong muốn phục vụ đời sống người Tin sinh học tính ứng dụng cao sống, đặc biệt lĩnh vực công nghệ sinh học, nông nghiệp y dược Các toán tin sinh học bao gồm: quản lý lưu trữ liệu, phân tích mối quan hệ trình tự, dự đốn cấu trúc trình tự, mơ hình hóa, nghiên cứu tiến hóa [4] Một toán quan trọng tin sinh học phân tích mối quan hệ trình tự, gọi tắt phân tích trình tự Các tốn phân tích trình tự là: tìm kiếm trình tự tương đồng sở liệu; hàng trình tự; chuyển đổi trình tự Mục tiêu phân tích trình tự là: Xác định gien chức gien Xác định lặp lại trình tự Xác định protêin dựa quy tắc đặt biểu thức gien Xác định vùng chức khác ADN Mục tiêu luận văn là: 1) Nắm bắt khái niệm tin sinh học sở liệu sinh học lớn giới, phương pháp giải toán hàng trình tự, tốn phân tích trình tự 2) Xây dựng sở liệu cục lưu trữ chuỗi gien tôm (bao gồm chuỗi nuclêơtít, protêin EST) tích hợp cơng cụ phân tích trình tự nhằm mục đích làm sáng tỏ vấn đề nghiên cứu lý thuyết Dữ liệu thu thập từ Phòng cơng nghệ AND ứng dụng - Viện Công nghệ sinh học (nay Viện Genome học) từ sở liệu sinh học Internet Đối tượng nghiên cứu luận văn chuỗi gene tôm thu thập từ Viện Công nghệ sinh học chuỗi gene tôm từ ngân hàng gene giới (genbank), bao gồm chuỗi EST, Nucleotide Protein Phạm vi nghiên cứu lý thuyết toán phân tích trình tự tin sinh học, phạm vi nghiên cứu thực nghiệm xây dựng sở liệu tích hợp cơng cụ BLAST tìm kiếm trình tự tương đồng sở liệu trình tự gien tơm (bao gồm trình tự nucltít, protêin EST) Phương pháp nghiên cứu luận văn nghiên cứu lý thuyết nghiên cứu thực nghiệm Về nghiên cứu lý thuyết: luận văn thực tổng hợp khái niệm kết nghiên cứu hàng trình tự Về nghiên cứu thực nghiệm: luận văn thực xây dựng sở liệu tích hợp cơng cụ tìm kiếm trình tự tương đồng BLAST sở liệu xây dựng nhằm sáng tỏ vấn đề lý thuyết Bố cục luận văn gồm phần mở đầu hai chương nội dung, phần kết luận danh mục tài liệu tham khảo Chương trình bày khái niệm tin sinh học, toán tin sinh học, sở liệu sinh học lớn giới số ứng dụng tin sinh học Chương trình bày tốn phân tích mối quan hệ trình tự thuật tốn so sánh trình tự Chương trình bày nội dung ứng dụng thử nghiệm làm sáng tỏ vấn đề nghiên cứu lý thuyết, bao gồm thiết kế xây dựng sở liệu lưu trữ trình tự gien tơm Sú, tích hợp cơng cụ tìm kiếm trình tự tương đồng BLAST sở liệu cục xây dựng Cuối cùng, phần kết luận nêu đóng góp luận văn, hướng phát triển 10 Chương CÁC KHÁI NIỆM BẢN 1.1 Các khái niệm sinh học phân tử Tin sinh học (Bioinformatics) lĩnh vực khoa học tính ứng dụng cao sống, đặc biệt lĩnh vực công nghệ sinh học, nông nghiệp ydược Tin sinh học lĩnh vực khoa học liên ngành, sinh học tin học đóng vai trò chủ đạo Về bản, tin sinh học tập trung vào nghiên cứu, phát triển áp dụng phương pháp công cụ tin học để giải toán sinh học Tiếp theo, luận văn giới thiệu số khái niệm sinh học phân tử Sinh học phân tử (molecular biology) nhánh sinh học (biology), tập trung nghiên cứu sinh vật mức độ phân tử Cụ thể là, sinh học phân tử tập trung giải trình tự (sequencing) phân tích trình tự nuclêơtít (trình tự ADN), trình tự axít amin (trình tự prơtêin) Trong phần này, luận văn tập trung giới thiệu kiến thức sinh học phân tử để sử dụng chương sau 1) Axít nuclêic nuclêơtít Axít nuclêic (nucleic acid) đại phân tử sinh học (large biological molecule) mang thông tin di truyền mã hóa chức năng, đặc điểm sinh vật sống Axít nuclêic gồm hai loại: ADN ( Axít Deoxyribo Nuclêic) ARN (Axít Ribo Nuclêic) Thành phần cấu tạo trình tự axít nuclêic phân tử hóa học nuclêotít (nucleotide) Trình tự ADN chứa bốn loại nuclêơtít khác là: Adenine, Cytosine, Guanine, Thymine Trình tự ARN thành phần tương tự trình tự ADN, ngoại trừ nuclêơtít Thymine thay nuclêơtít Uracil Tức là, ARN chứa loại nuclêơtít: Adenine, Cytosine, Guanine, Uracil Tên đầy đủ, tên viết tắt năm loại nuclêơtít mơ tả Bảng 1.1 Bảng 1.1 Tên đầy đủ, tên viết tắt loại nuclêơtít: STT Tên đầy đủ Adenine Cytosine Guanine Thymine Uracil Tên viết tắt A C G T U Tích hợp cơng cụ tìm kiếm BLAST: Thực tìm kiếm chuỗi tương đồng BLAST sở liệu xây dựng 3.3.2 Mơ hình luồng liệu 1) Mơ hình luồng liệu mức khung cảnh Dữ liệu chuỗi gien cần tra cứu Thông tin người sử dụng Thông tin BLAST Quản lý sở liệu hệ gien tôm Kết tra cứu Kết BLAST Người quản trị Người sử dụng Tệp XML Dữ liệu chuỗi gien cần nhập liệu Tài khoản NSD 2) Mơ hình luồng liệu mức đỉnh sở liệu hệ gien tôm Dữ liệu chuỗi gien cần tra cứu Thông tin người sử dụng Yêu cầu hiển thị Quản trị hệ thống Kết tra cứu Người sử dụng Thông tin hiển thị Người quản trị Tài khoản NSD sở liệu hệ gien tôm Dữ liệu chuỗi gien cần nhập Tệp XML Xử lý liệu Phân tích trình tự Thơng tin BLAST Kết BLAST 3) Mơ hình luồng liệu mức đỉnh Mơ hình luồng liệu mô tả chức quản trị hệ thống Thông tin người sử dụng Đăng ký NSD Hiển thị thông tin Thông tin hiển thị Yêu cầu hiển thị Người sử dụng Người quản trị Tài khoản NSD sở liệu hệ gien tôm Dữ liệu chuỗi gien cần tra cứu Thông tin, báo cáo CSDL Kết xuất báo cáo Tìm kiếm, tra cứu thơng tin Mơ hình luồng liệu mơ tả chức xử lý liệu BLAST Kết tra cứu Kết BLAST Chuỗi gien cần BLAST Dữ kiệu chuỗi gien Nhập liệu Tìm kiếm chuỗi tương đồng BLAST Người sử dụng sở liệu hệ gien tôm Nạp liệu từ tệp XML Dữ liệu chuỗi gien Cập nhật liệu Tệp liệu XML chuỗi gien từ Internet 3.3.3 Đặc tả chi tiết số chức 1) Chức tìm kiếm thơng tin (Database) Chức tìm kiếm thơng tin bao gồm hai chức Tìm kiếm (Search) Tìm kiếm nâng cao (Advanced search)  - Tìm kiếm bao gồm: ComboBox để chọn loại chuỗi gien cần tìm (EST, Protein hay Nucleotide) - TextBox để nhập từ khóa cần tìm Thuật tốn tìm kiếm tìm tất trường, ví dụ nhập vào từ khóa “12345” thực chất sử dụng câu lệnh SQL sau : (fields1 like’%12345%’ ) and ( field2 like ‘%12345%’) and……  Tìm kiếm nâng cao bao gồm: - ComBox để chọn trường cần tìm kiếm - TextBox để gõ từ khóa cần tìm kiếm - ComBox để chọn từ khóa quan hệ (and, or, not) Mỗi lần nhấn thêm vào tìm kiếm (Add to Search Box) điều kiện thêm vào  Hiển thị thông tin: - Phân trang: Mỗi lần ấn Tìm kiếm (Search) kết thị theo trang kết quả, kết tìm thị trang, tất số trang lưu ComboBox, cho phép chọn đến trang bất kì, chọn số lượng kết trang - Hiển thị kết tìm kiếm theo chuẩn FASTA GENBANK 2) Chức nhập liệu (Add data) Mô tả chức Chức nhập liệu cho phép người sử dụng thêm ghi trình tự EST, Nucleotide tơm lưu trữ Viện công nghệ sinh học vào CSDL Đặc tả chi tiết chức  Giao diện nhập thông tin chung người sử dụng vào chức - Type (Loại chuỗi gien): Cho phép chọn chuỗi Nucleotide, Protein EST cần nhập - Accession (Mã hiệu chuỗi gien), Name (Tên chuỗi gien), Definition (Định nghĩa), Origin (Nguồn gốc): Do người sử dụng nhập vào  Sau nhập thông tin trên, nhấn nút Confirm (Chấp nhận) xuất Form nhập thông tin chi tiết cho chuỗi cần nhập: - Change (Thay đổi): Cho phép người sử dụng thay đổi lại thông tin nhập CSDL  - Add new (Thêm mới): Cho phép người sử dụng thêm ghi vào CSDL Giao diện nhập chi tiết cho chuỗi: Save (Ghi liệu): Thực ghi liệu chuỗi gien tôm Sau thực chức này, hai chức ghi thông tin tham chiếu gien đặc trưng gien xuất hiện, cho phép NSD lưu thêm thông tin tham chiếu đặc trưng chuỗi gien Chú ý rằng, chức ghi liệu chuỗi gien thực lần, hai chức ghi thông tin tham chiếu gien ghi thơng tin đặc trưng gien thực nhiều lần thơng tin nhiều ghi mã chuỗi gien Nếu thơng tin lưu thơng báo cho người sử dụng biết.Nếu thông tin Accession tồn sở liệu, lưu thông tin, thơng báo cho người sử dụng biết để thay đổi - Update (Cập nhật): Giúp người quản trị cập nhật lại thông tin cần thay đổi lưu lại trước Nếu thơng tin cập nhật thơng báo cho người quản trị biết - Delete (Xóa liệu): chức xóa form này: Xóa thơng tin tham chiếu: giúp xóa thơng tin tham chiếu vừa lưu trữ Xóa thơng tin đặc trưng: giúp xóa thơng tin đặc trưng vừa lưu trữ Xóa tất cả: giúp xóa tất thơng tin chuỗi gien, tham chiếu đặc trưng vừa lưu trữ Khi người sử dụng chọn chức xóa liệu thơng báo hỏi trước thực việc xóa thơng tin.Nếu thơng tin xóa thơng báo cho người sử dụng biết 3) Chức cập nhật liệu (Update data) Mô tả chức Chức cập nhật liệu cho phép người sử dụng cập nhật ghi CSDL chuỗi EST, Nucleotide, Protêin tôm Đặc tả chi tiết chức  Giao diện người sử dụng vào chức năng: - Khi người sử dụng nhập thông tin mã chuỗi gien (Accession), chức hiển thị (Show) hiển thị ghi mã chuỗi gien nhập hình Trái lại, thơng báo u cầu nhập thơng tin - Gợi ý (Suggestion): Hiển thị thông tin mã chuỗi gien (Accession) gần giống với mã chuỗi gien người sử dụng nhập vào nhằm mục đích giúp đưa gợi ý người sử dụng khơng nhớ xác thơng tin mã chuỗi gien mà cần - Cập nhật (Edit): Chức bao gồm hai chức cập nhật (Update) hủy (Cancel) Khi người sử dụng muốn thay đổi ghi đó, chọn chức cập nhật, hai chức cập nhật hủy hiển thị Sau thay đổi thông tin ghi mong muốn, chức cập nhật giúp người sử dụng cập nhật lại thông tin vào sở liệu Nếu không muốn thay đổi thơng tin ghi ngưởi sử dụng chọn chức hủy Nếu ghi cập nhật thơng báo cho người sử dụng biết - Xóa liệu (Delete): Chức xóa ghi chuỗi gien tơm giúp người sử dụng xóa ghi thơng tin bảng lưu trữ chuỗi gien tôm (TrinhTu), đồng thời ghi hai bảng tham chiếu (ThamChieu) đặc trưng (DacTrung) mã chuỗi gien nhập bị xóa Chức xóa ghi tham chiếu xóa ghi đặc trưng giúp người sử dụng xóa ghi thông tin hai bảng tham chiếu đặc trưng, hai chức xóa tách biệt, khơng làm ảnh hưởng đến ghi thơng tin bảng lại Nếu ghi xóa thơng báo cho người sử dụng biết - Thêm liệu (Add): Chức thêm liệu tham chiếu thêm liệu đặc trưng giúp người sử dụng thêm ghi vào hai bảng lưu thông tin tham chiếu (ThamChieu) đặc trưng (DacTrung) 4) Chức nạp liệu từ tệp XML (Load XML) Mô tả chức Chức cho phép nạp liệu vào CSDL từ tệp XML chứa thông tin chuỗi Nucleotide, Protein EST tôm theo định dạng INSDSeq XML Các tệp XML lấy từ ngân hàng Gen giới (GenBank) Internet Mơ hình chức CSDL ngân hàng Gen giới Tệp XML CSDL chuỗi gien tôm (Database) Đặc tả chức Cho phép chọn nạp liệu vào hệ thống CSDL theo chuỗi sau:  Nạp liệu chuỗi EST  Nạp liệu chuỗi Nucleotide  Nạp liệu chuỗi Protein Ghi liệu vào bảng lưu trữ liệu chuỗi Nucleotide, Protein EST (TrinhTu), bảng lưu trữ thông tin tham chiếu (ThamChieu) bảng lưu trữ thông tin đặc trưng (DacTrung) từ tệp XML (INSDSeq) lấy từ Internet Các trường sau ghi liệu ngầm định vào bảng TrinhTu  Mã loại gien (LoaiGien): Ghi giá trị mã loại gien (LoaiGien) bảng danh mục chuỗi Nucleotide, Protein EST (LoaiGien) chọn NhapLieu: Ngầm định ghi giá trị „0‟ (Dữ liệu nạp vào CSDL từ Internet), liệu nhập vào CSDL, trường nhận giá trị „1‟ 5) Chức BLAST Tạo CSDL BLAST: Với ghi CSDL chung ta xuất tệp Text theo chuẩn Fasta, CSDL Blast tập hợp tệp Text chuẩn Fasta CSDL chung (Database) Tệp Fasta CSDL Blast Thực BLAST: Với trình tự nhập vào (Nucleotide Protein) chương trình thực BLAST (BLAST P BLAST N) hiển thị kết theo khuôn dạng FASTA GENBANK 3.4 Một số giao diện chương trình 3.4.1 Giao diện trang chủ 3.4.2 Nạp liệu từ tệp XML Cho phép nạp thông tin từ tệp XML chứa chuỗi Protein, Nucleotide, EST Tôm lấy từ ngân hàng Gen vào hệ thống CSDL Giao diện nạp liệu từ XML 3.4.3 Nhập liệu trình tự Protein, Nucleotide, EST Ngồi chức nạp thơng tin vào hệ thống CSDL từ tệp XML tải từ ngân hàng Gene hệ thống hỗ trợ chức cập nhật thông tin, cho phép NSD cập nhật thông tin chuỗi Protein, Nucleotide, EST Viện cơng nghệ sinh học vào hệ thống CSDL Chức cho phép nhập thông tin chuỗi gien, nhập thông tin tham chiếu nhập thông tin đặc trưng Giao diện nhập thông tin chuỗi gien tôm (Locus Informations) Giao diện nhập thông tin tham chiếu (Reference Informations) Giao diện nhập thông tin đặc trưng (Features Informations) 3.4.4 Tra cứu thông tin Giao diện tra cứu thông tin Kết tra cứu hiển thị theo chuẩn GENBANK Kết tra cứu hiển thị theo chuẩn FASTA 3.4.5 Tìm kiếm chuỗi tương đồng BLAST Nút tạo Private Database KẾT LUẬN Những kết luận văn Luận văn đạt hai kết chính: 1) Nắm bắt khái niệm tin sinh học, bao gồm: khái niệm sinh học phân tử, toán tin sinh học sở liệu sinh học lớn giới; Nắm bắt thuật tốn giải tốn phân tích mối quan hệ trình tự (bài tốn hàng trình tự), toán cốt yếu tin sinh học 2) Xây dựng ứng dụng thử nghiệm làm sáng tỏ vấn đề nghiên cứu lý thuyết, bao gồm sở liệu lưu trữ trình tự gien tơm tích hợp cơng cụ BLAST tìm kiếm trình tự tương đồng sở liệu xây dựng Hướng phát triển Tiếp tục nghiên cứu thử nghiệm toán khác tin sinh học Tài liệu tham khảo Tài liệu tiếng Việt [1] Nguyễn Văn Cách, Tin sinh học, Đại học Bách Khoa Hà Nội, 2005 [2] Ngô Công Thắng, Bài giảng tin sinh học, Trường Đại học Nông nghiệp Hà Nội [3] Võ Hồng Bảo, Cải tiến ClustalW cho tốn hàng đa trình tự, Luận văn Thạc sĩ, Đại học Quốc gia thành phố Hồ Chí Minh Tài liệu tiếng Anh [4] A Lesk, Introduction to Bioinformatics, Oxford University Press, 2008 [5] Jo McEntyre, Jim Ostell (eds), The NCBI Handbook, Bethesda: National Center for Biotechnology Information, 2002 Richard Durbin, Sean R Eddy, Anders Krogh, Graeme Mitchison, [6] Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge: Cambridge University Press, 1998 Salemi and Vandamme (eds), The Phylogenetics Handbook A Practical [7] Approach to DNA and Protein Phylogeny, Cambridge: Cambridge University Press, Cambridge, 2003 EMBL database: http://www.embl.org/ [8] [9] NCBI database: http://www.ncbi.nlm.nih.gov/ [10] DDBJ database: http://www.ddbj.nig.ac.jp/ ... mục tài liệu tham khảo Chương trình bày khái niệm tin sinh học, toán tin sinh học, sở liệu sinh học lớn giới số ứng dụng tin sinh học Chương trình bày tốn phân tích mối quan hệ trình tự thuật... thuyết tốn phân tích trình tự tin sinh học, phạm vi nghiên cứu thực nghiệm xây dựng sở liệu tích hợp cơng cụ BLAST tìm kiếm trình tự tương đồng sở liệu trình tự gien tơm Sú (bao gồm trình tự nucltít,... hợp cơng cụ phân tích trình tự nhằm mục đích làm sáng tỏ vấn đề nghiên cứu lý thuyết Dữ liệu thu thập từ Phòng cơng nghệ AND ứng dụng - Viện Cơng nghệ sinh học (nay Viện Genome học) từ sở liệu sinh

Ngày đăng: 19/02/2019, 07:55

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan