Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

83 757 0
Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NÔNG LÂM TP HỒ CHÍ MINH BỘ MƠN CƠNG NGHỆ SINH HỌC ***000*** TRẦN NGUYỄN MINH ĐĂNG XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Thành phố Hồ Chí Minh Tháng 09/2006 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NƠNG LÂM TP HỒ CHÍ MINH BỘ MƠN CÔNG NGHỆ SINH HỌC ***000*** XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Luận văn kỹ sƣ Chuyên ngành: Công Nghệ Sinh Học Giáo viên hƣớng dẫn: Sinh viên thực hiện: TS TRẦN THỊ DUNG TRẦN NGUYỄN MINH ĐĂNG Cử Nhân LƢU PHÚC LỢI Khóa: 2002-2006 Thành phố Hồ Chí Minh Tháng 09/2006 MINISTRY OF EDUCATION AND TRAINING NONG LAM UNIVERSITY, HCMC DEPARTMENT OF BIOTECHNOLOGY ***000*** BUILDING SSRs (SIMPLE SEQUENCE REPEATS) DATABASE FROM ESTs (EXPRESSED SEQUENCE TAGS) OF PINEAPPLE (Ananas comosus) Graduation thesis Major: Biotechnology Professor Student PhD Tran Thi Dung TRAN NGUYEN MINH DANG BSc LƢU PHÚC LỢI Term: 2002 - 2006 Ho Chi Minh City 09/2006 LỜI CẢM ƠN XIN CHÂN THÀNH CẢM ƠN Ban Giám Hiệu trƣờng Đại học Nơng Lâm Tp Hồ Chí Minh tạo điều kiện cho suốt thời gian học tập Các thầy cô môn Công Nghệ Sinh Học thầy cô trực tiếp giảng dạy suốt bốn năm qua Xin bày tỏ lòng biết ơn sâu sắc đến:  TS Trần Thị Dung  Cử Nhân Lƣu Phúc Lợi Đã tận tụy hƣớng dẫn, truyền đạt kiến thức giúp cho tơi hồn thành khóa luận Cùng tồn thể lớp Cơng Nghệ Sinh Học 28 thân thiện hỗ trợ, giúp đỡ động viên suốt thời gian làm đề tài Thành kính ghi ơn ba mẹ ngƣời thân gia đình ln tạo điều kiện động viên suốt trình học tập trƣờng Tháng 08 năm 2006 Trần Nguyễn Minh Đăng iv TÓM TẮT KHỐ LUẬN TRẦN NGUYỄN MINH ĐĂNG, đại học Nơng Lâm TP Hồ Chí Minh, tháng 08/2006 “XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus)” Hội đồng hướng dẫn:  TS Trần Thị Dung  Cử Nhân Lưu Phúc Lợi Khóa luận thực mơn Công Nghệ Sinh Học, trường đại học Nông Lâm TP Hồ Chí Minh, khoảng thời gian từ tháng 3/2006 đến 8/2006 Trong năm qua sinh học không ngừng phát triển, tạo kho liệu lớn trình tự gene, protein, thực vật, động vật,… Và với thành tựu vốn có cơng nghệ thơng tin, trình tự gene lưu trữ sở liệu sinh học lớn NCBI, EMBL, DDBj,…Vì sở liệu lớn chứa nhiều thông tin khác nhau, không tập trung thành gene cụ thể nên khó thực việc truy xuất thông tin phục vụ trực tiếp cho nghiên cứu chuyên biệt, có phương pháp microsatellite Do vậy, mục tiêu tiến hành xây dựng sở liệu SSRs từ ESTs dứa Ananas comosus lấy sở liệu sinh học NCBI Để đạt mục tiêu trên, khóa luận cần đảm bảo thực nội dung sau:  Dùng Perl script để thu nhận trình tự nucleotide gene từ trang sở liệu GenBank NCBI  Tìm tách đoạn microsatellite có đoạn gen  Tìm hiểu mơ hình liệu quan hệ, sử dụng mơ hình vào việc lưu trữ liệu trình tự nucleotide trình tự SSRs Ananas comosus, tạo sở liệu chứa trình tự Sau chuyển liệu vào sở liệu  Kết hợp phần mềm quản lý sở liệu phần mềm tạo web, thiết kế trang web chia sẻ thông tin với người dùng v MỤC LỤC Nội dung Trang LỜI CẢM ƠN .iv TĨM TẮT KHỐ LUẬN .v DANH SÁCH CÁC HÌNH x DANH SÁCH CÁC BẢNG xi DANH SÁCH CÁC TỪ VIẾT TẮT xii Phần Mở đầu 1.1 Đặt vấn đề 1.1.1 Sơ lược sinh – tin học 1.1.2 Sơ lược dứa .2 1.1.3 Sơ lược phương pháp Microsatellite 1.2 Mục tiêu khóa luận Phần Tổng quan tài liệu 2.1 Giới thiệu dứa 2.1.1 Vị trí phân loại 2.1.2 Nguồn gốc phân bố .4 2.1.3 Đặc điểm hình thái .5 2.1.3.1 Rễ 2.1.3.2 Thân 2.1.3.3 Lá 2.1.3.4 Hoa 2.1.3.5 Quả 2.3.1.6 Hạt 2.1.4 Đặc điểm trồng trọt 2.1.4.1 Yếu tố khí hậu 2.1.4.2 Yếu tố đất đai 2.1.4.3 Yếu tố sinh vật 2.1.5 Giá trị kinh tế sử dụng 2.1.6 Các giống trồng 2.1.6.1 Nhóm Cayenne 2.1.6.2 Nhóm Queen 2.1.6.3 Nhóm Spanish vi 2.1.6.4 Nhóm Abacaxi 10 2.1.6.5 Các giống trồng nước 11 2.1.7 Tình hình phát triển dứa nước 11 2.2 Các Marker phân tử 12 2.2.1 Isozymes 12 2.2.2 ALP 12 2.2.3 AFLP 12 2.2.4 RAPD 13 2.2.5 SSCP 14 2.2.6 SNP 14 2.2.7 SSR 15 2.2.8 Kỹ thuật STS SCARP 15 2.2.9 RFLP 15 2.3 Chi tiết microsatellite 16 2.3.1 Định nghĩa 16 2.3.2 Các phương pháp phát microsatellite 16 2.3.2.1 Phương pháp lai 17 2.3.2.2 Phương pháp PCR 17 2.3.3 Vai trò microsatellite 18 2.3.4 Ứng dụng 19 2.4 EST 19 2.4.1 Sơ lược EST 19 2.4.2 Nguồn gốc EST 20 2.5 Cơ sở liệu hệ quản trị sở liệu 20 2.5.1 Nguyên nhân đời mơ hình quan hệ .20 2.5.2 Cơ sở liệu hệ quản trị sở liệ 21 2.5.2.1 Định nghĩa sở liệu 21 2.5.2.2 Hệ quản trị sở liệu 21 2.5.3 Các mơ hình liệu 23 2.5.3.1 Định nghĩa 23 2.5.3.2 So sánh mơ hình liệu 23 2.5.4 Người dùng .24 2.5.5 Cơ sở liệu quan hệ hệ tập tin theo lối cũ 25 2.5.5.1 Vấn đề 1: Cấu trúc logic cấu trúc vật lý 25 vii 2.5.5.2 Vấn đề 2: Dư thừa liệu 25 2.5.5.3 Vấn đề 3: Sự khai thác liệu người sử dụng 25 2.6 Internet Web 26 2.6.1 Sơ lược Internet 26 2.6.1.1 Tóm lược lịch sử phát triển 26 2.6.1.2 Tổng quát Internet 26 2.6.2 Các dịch vụ cung cấp Internet .28 2.6.2.1 Phân loại khối thông tin 28 2.6.2.2 Các dịch vụ 28 2.6.3 Tích hợp sở dự liệu với web 28 2.7 Ngôn ngữ lập trình Perl Javascript 28 2.7.1 Ngôn ngữ Perl 28 2.7.1.1 Tóm tắt lịch sử phát triển 28 2.7.1.2 Ứng dụng 29 2.7.1.3 Một số module Perl thường sử dụng 29 2.7.2 Ngôn ngữ Javascript .30 2.7.2.1 Định nghĩa Javascript 31 2.7.2.2 Javascript làm gì? 31 2.7.2.3 Ưu nhược điểm Javascript 31 2.8 Cơ sở liệu sinh học 32 2.8.1 NCBI 32 2.8.1.1 Vài nét NCBI 32 2.8.1.2 Một số sở liệu NCBI 33 2.8.1.3 Một số công cụ NCBI 33 Phần Phƣơng pháp chƣơng trình sử dụng .35 3.1 Các chƣơng trình ngơn ngữ lập trình đƣợc sử dụng 35 3.1.1 Hệ điều hành .35 3.1.2 Các chương trình phân tích trình tự .35 3.1.2.1 Chương trình so sánh trình tự ClustalW 35 3.1.2.2 Chương trình tìm kiếm trình tự tương đồng – BLAST 36 3.1.2.3 Hệ trị CSDL quan hệ MySQL 36 3.1.2.4 Apache web Server 37 3.2 Thu nhận trình tự SSRs 38 3.2.1 Thu thập chọn lọc liệu 40 viii 3.2.2 Thu nhận trình tự SSR .41 3.3 Xây dựng CSDL, công cụ để giúp ngƣời dùng khai thác tốt liệu 44 3.3.1 Xây dựng sở liệu 44 3.3.1.1 Tạo bảng chứa liệu 44 3.3.1.2 Xây dựng mối quan hệ 46 3.3.1.3 Nhập liệu vào bảng 47 3.4 Thiết kế giao diện web để truy xuất thông tin sở liệu 47 3.5 Tích hợp cơng cụ sinh học vào trang web 48 Phần Kết thảo luận .49 4.1 Kết thu nhận trình tự microsatellite 49 4.1.1 Kết thu nhận trình tự Ananas comosus 49 4.1.2 Kết thu nhận trình tự SSRs 50 4.2 Xây dựng CSDL, cơng cụ để giúp ngƣời dùng khai thác tốt liệu 51 4.2.1 Cơ sở liệu trình tự Ananas comosus 51 4.2.2 Kết sau lập CSDL trình tự microsatellite 52 4.2.3 Mơ hình quan hệ .57 4.3 Trang web thể thông tin sở liệu SSRs Ananas comosus 59 4.3.1 Trang chủ (HOME PAGE) .60 4.3.2 Trang thông tin microsatellite (ABOUT SSRs PAGE) 60 4.3.3 Trang thông tin Ananas comosus (Ananas comosus PAGE) 60 4.3.4 Trang sở liệu ESTs (ESTs PAGE) 61 4.3.5 Trang sở liệu SSRs (SSRs PAGE) 62 4.3.6 Trang công cụ 64 4.3.6.1 Trang tích hợp cơng cụ để tìm kiếm SSR 64 Phần Kết luận đề nghị 65 5.1 Kết luận 65 5.2 Đề nghị 65 Phần Tài liệu tham khảo 66 ix DANH SÁCH CÁC HÌNH Hình Trang Hình 1 Định nghĩa bioinformatics mở rộng Hình Tìm hiểu nguồn gốc dựa vào Microsatellite Hình Các giống dứa Natal Queen - Red Spanish – Cayenne 11 Hình 2 Sơ đồ hệ quản trị sở liệu 22 Hình So sánh sở liệu quan hệ hệ tập tin theo lối cũ 25 Hình Tương tác Perl script-DBI-DBD-và RBDMS 30 Hình Tương quan NCBI, NLM (National Library of Medicine NIH) 32 Hình Sơ đồ tóm tắt q trình thu nhận trình tự SSR Steven Schroeder 38 Hình Kết thiết kế mồi cuối Steven Schroeder 39 Hình 3 Sơ đồ tóm tắt q trình thu nhận trình tự từ NCBI 40 Hình Sơ đồ tóm tắt q trình thu nhận trình tự microsatellite 41 Hình Nội dung tập tin “sequence31052006.txt” để thu nhận SSR 42 Hình Nội dung tập tin “ssrout31052006.txt” 42 Hình Nội dung tập tin “labdbout31052006.txt” 43 Hình Nội dung tập tin “new_ids31052006.txt” 44 Hình Sơ đồ trình tự nhập liệu vào bảng 47 Hình 10 Trang web mẫu trình tự microsatellite 48 Hình Nội dung mẫu tin Ananas comosus NCBI 50 Hình Mơ hình quan hệ bảng 57 Hình Sơ đồ cấu trúc trang web 59 Hình 4 Nội dung trang thông tin microsatellite 60 Hình Nội dung trang thông tin Ananas comosus 61 Hình Trang sở liệu ESTs 61 Hình Trang sở liệu SSRs (All) 62 Hình Trang sở liệu SSRs chọn lọc theo “Motif Length Group ID” 63 Hình Trang web tìm kiếm trình tự microsatellite 64 x ... HỌC NÔNG LÂM TP HỒ CHÍ MINH BỘ MƠN CƠNG NGHỆ SINH HỌC ***000*** XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Luận văn kỹ... đại học Nông Lâm TP Hồ Chí Minh, tháng 08/2006 “XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus)” Hội đồng hướng dẫn:  TS Trần... ? ?Xây dựng sở liệu SSRs (Simple Sequence Repeats) từ ESTs (Expressed Sequence Tags) dứa (Ananas comosus)” thực với mục tiêu sau: Thu nhận trình tự SSR dứa từ CSDL ESTs lấy trang NCBI Hai xây dựng

Ngày đăng: 19/11/2012, 15:19

Hình ảnh liên quan

Hình 1.1. Định nghĩa bioinformatics đƣợc mở rộng 1.1.2. Sơ lƣợc về cây dứa (Ananas comosus)  - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 1.1..

Định nghĩa bioinformatics đƣợc mở rộng 1.1.2. Sơ lƣợc về cây dứa (Ananas comosus) Xem tại trang 14 của tài liệu.
Hình 1.2. Tìm hiểu nguồn gốc dựa vào Microsatellite 1.2. Mục tiêu của khóa luận  - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 1.2..

Tìm hiểu nguồn gốc dựa vào Microsatellite 1.2. Mục tiêu của khóa luận Xem tại trang 15 của tài liệu.
Hình 2.1. Các giống dứa Natal Quee n- Red Spanish – Cayenne - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 2.1..

Các giống dứa Natal Quee n- Red Spanish – Cayenne Xem tại trang 23 của tài liệu.
Hình 2.2. Sơ đồ một hệ quản trị cơ sở dữ liệu - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 2.2..

Sơ đồ một hệ quản trị cơ sở dữ liệu Xem tại trang 34 của tài liệu.
Hình 2.3. So sánh cơ sở dữ liệu quan hệ và hệ tập tin theo lối cũ - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 2.3..

So sánh cơ sở dữ liệu quan hệ và hệ tập tin theo lối cũ Xem tại trang 37 của tài liệu.
Hình 2.4. Tƣơng tác giữa Perl script-DBI-DBD-và RBDMS 2.7.2. Ngôn ngữ Javascript [6] - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 2.4..

Tƣơng tác giữa Perl script-DBI-DBD-và RBDMS 2.7.2. Ngôn ngữ Javascript [6] Xem tại trang 42 của tài liệu.
Hình 3.1. Sơ đồ tóm tắt quá trình thu nhận trình tự SSR của Steven Schroeder - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 3.1..

Sơ đồ tóm tắt quá trình thu nhận trình tự SSR của Steven Schroeder Xem tại trang 50 của tài liệu.
Hình 3.2. Kết quả thiết kế mồi cuối cùng của Steven Schroeder - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 3.2..

Kết quả thiết kế mồi cuối cùng của Steven Schroeder Xem tại trang 51 của tài liệu.
Hình 3.3. Sơ đồ tóm tắt quá trình thu nhận trình tự chính từ NCBI - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 3.3..

Sơ đồ tóm tắt quá trình thu nhận trình tự chính từ NCBI Xem tại trang 52 của tài liệu.
Hình 3.4. Sơ đồ tóm tắt quá trình thu nhận trình tự microsatellite - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 3.4..

Sơ đồ tóm tắt quá trình thu nhận trình tự microsatellite Xem tại trang 53 của tài liệu.
Bảng 3.2. Nội dung tblMotifLengthGroup Tên trƣờng Kiểu dữ  - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Bảng 3.2..

Nội dung tblMotifLengthGroup Tên trƣờng Kiểu dữ Xem tại trang 57 của tài liệu.
Bảng 3.3. Nội dung tblEST Tên trƣờng  Kiểu dữ  - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Bảng 3.3..

Nội dung tblEST Tên trƣờng Kiểu dữ Xem tại trang 57 của tài liệu.
Bảng 3.5. Nội dung tblSSR Tên trƣờng  Kiểu dữ  - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Bảng 3.5..

Nội dung tblSSR Tên trƣờng Kiểu dữ Xem tại trang 58 của tài liệu.
Hình 3. 10. Trang web mẫu về trình tự microsatellite - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 3..

10. Trang web mẫu về trình tự microsatellite Xem tại trang 60 của tài liệu.
Bảng 4.1. Phân loại giống Ananas comosus tại NCBI - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Bảng 4.1..

Phân loại giống Ananas comosus tại NCBI Xem tại trang 61 của tài liệu.
Hình 4.1. Nội dung mẫu tin về Ananas comosus trên NCBI - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 4.1..

Nội dung mẫu tin về Ananas comosus trên NCBI Xem tại trang 62 của tài liệu.
4.1.2. Kết quả thu nhận trình tự SSRs - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

4.1.2..

Kết quả thu nhận trình tự SSRs Xem tại trang 62 của tài liệu.
Bảng 4.3. Các trình tự SSRs trên cây dứa Ananas comosus có trong CSDL - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Bảng 4.3..

Các trình tự SSRs trên cây dứa Ananas comosus có trong CSDL Xem tại trang 64 của tài liệu.
Qua bảng 4.2, có 2 loại microsatellites trong một trình tự nên có thể phục vụ nhiều công tác nghiên cứu khác nhau trong một trình tự đó - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

ua.

bảng 4.2, có 2 loại microsatellites trong một trình tự nên có thể phục vụ nhiều công tác nghiên cứu khác nhau trong một trình tự đó Xem tại trang 69 của tài liệu.
Bảng 4. 4. Ví dụ nhiều đoạn microsatellite trong một trình tự chính - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Bảng 4..

4. Ví dụ nhiều đoạn microsatellite trong một trình tự chính Xem tại trang 69 của tài liệu.
Cấu trúc của các trang web thể hiện ở hình 4.3 - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

u.

trúc của các trang web thể hiện ở hình 4.3 Xem tại trang 71 của tài liệu.
 Hình thức thể hiện: - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình th.

ức thể hiện: Xem tại trang 72 của tài liệu.
Hình 4.5. Nội dung trang thông tin về Ananas comosus 4.3.4. Trang cơ sở dữ liệu ESTs (ESTs PAGE)  - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 4.5..

Nội dung trang thông tin về Ananas comosus 4.3.4. Trang cơ sở dữ liệu ESTs (ESTs PAGE) Xem tại trang 73 của tài liệu.
 Hình thức thể hiện: - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình th.

ức thể hiện: Xem tại trang 73 của tài liệu.
Hình 4. 7. Trang cơ sở dữ liệu SSRs (All) - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 4..

7. Trang cơ sở dữ liệu SSRs (All) Xem tại trang 74 của tài liệu.
Hình 4. 8. Trang cơ sở dữ liệu SSRs chọn lọc theo “MotifLengthGroup ID” là MO04  - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 4..

8. Trang cơ sở dữ liệu SSRs chọn lọc theo “MotifLengthGroup ID” là MO04 Xem tại trang 75 của tài liệu.
Hình 4. 9. Trang web tìm kiếm trình tự microsatellite - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

Hình 4..

9. Trang web tìm kiếm trình tự microsatellite Xem tại trang 76 của tài liệu.
 Một số hình ảnh trong trang web trong CSDL microsatellite của Ananas comosus  - Xây dựng cơ sở dữ liệu SSRs từ ESTs của cây dứa

t.

số hình ảnh trong trang web trong CSDL microsatellite của Ananas comosus Xem tại trang 80 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan