Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
2,94 MB
Nội dung
i BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NƠNG LÂM TP HỒ CHÍ MINH BỘ MƠN CƠNG NGHỆ SINH HỌC ************ KHÓA LUẬN TỐT NGHIỆP KHAI THÁC DỮ LIỆU ESTs (EXPRESSED SEQUENCE TAGs) Ở CHI CAM CHANH (CITRUS) CHO VIỆC PHÁT TRIỂN MARKER PHÂN TỬ SSR (SIMPLE SEQUENCE REPEATS) Ngành học: CƠNG NGHỆ SINH HỌC Niên khóa: 2003-2007 Sinh viên thực hiện: LƢU TRẦN CÔNG HUY Thành phố Hồ Chí Minh Tháng 9/2007 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ii LỜI CẢM ƠN Xin gửi lòng biết ơn sâu sắc đến ba mẹ gia đình hết lòng hỗ trợ, động viên mặt để tơi hồn thành đề tài Xin chân thành cảm tạ Ban Giám hiệu Trƣờng Đại học Nông Lâm Thành Phố Hồ Chí Minh Ban chủ nhiệm Bộ Mơn Cơng nghệ Sinh Học tất quý thầy cô truyền đạt kiến thức cho tơi suốt q trình học trƣờng Chân thành cảm ơn TS Trần Thị Dung tận tình hƣớng dẫn, giúp đỡ tơi suốt thời gian thực đề tài tốt nghiệp Xin cảm ơn CN Lƣu Phúc Lợi giúp đỡ, hỗ trợ kiến thức tài liệu chuyên môn Xin cảm ơn bạn bè thân yêu lớp DH03SH chia sẻ vui buồn thời gian học nhƣ hết lịng hỗ trợ, giúp đỡ tơi thời gian thực đề tài Tp Hồ Chí Minh tháng 08 năm 2007 Sinh viên thực Lƣu Trần Công Huy LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com iii TĨM TẮT KHỐ LUẬN LƢU TRẦN CƠNG HUY, Đại Học Nơng Lâm TP Hồ Chí Minh, tháng 07/2007 “KHAI THÁC DỮ LIỆU ESTs (EXPRESSED SEQUENCE TAGs) Ở CHI CAM CHANH (CITRUS) CHO VIỆC PHÁT TRIỂN MARKER PHÂN TỬ SSR (SIMPLE SEQUENCE REPEATS)” Hội đồng hƣớng dẫn TS Trần Thị Dung Cử Nhân Lƣu Phúc Lợi Khóa luận đƣợc thực môn Công Nghệ Sinh Học, trƣờng đại học Nơng Lâm TP Hồ Chí Minh, khoảng thời gian từ tháng 3/2007 đến 8/2007 Trong năm qua, sinh học không ngừng phát triển tạo kho liệu miễn phí trực tuyến lớn trình tự gene, protein, gene thực vật lẫn động vật nhƣ sở liệu sinh học lớn nhƣ NCBI, EMBL, DDBj… Một CSDL lớn ESTs (Expressed Sequence Tags), có ESTs chi cam chanh (citrus) Những trình tự ESTs đƣợc sử dụng để khai thác SSRs (Simple Sequence Repeats) Những SSRs hữu ích chúng có nhiều ứng dụng nhƣ genome mapping, phenotype mapping chọn giống thực vật nhờ marker phân tử Hơn nữa, việc phát triển marker SSR từ EST có chi phí thấp so với phƣơng pháp phân lập SSR truyền thống Để đạt đƣợc mục tiêu trên, khóa luận cần đảm bảo thực nội dung nhƣ sau: 1) Dùng Perl script để thu nhận trình tự nucleotide ESTs Citrus vừa tìm từ trang sở liệu GenBank NCBI 2) Tìm tách đoạn microsatellite có đoạn gen 3) Tìm SSR nằm vùng gen kháng virus Tristeza LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com iv 4) Tìm hiểu mơ hình liệu quan hệ, sử dụng mơ hình vào việc lƣu trữ liệu trình tự nucleotide trình tự SSRs chi cam chanh (Citrus), tạo sở liệu chứa trình tự Sau đƣa liệu vào sở liệu 5) Trang web đƣợc thiết kế để chia sẻ thông tin trực tuyến với ngƣời dùng Kết Thu nhận đƣợc 191.110 trình tự ESTs lồi Citrus đƣợc thu thập từ CSDL dbEST CoreNucleotide GenBank Những trình tự ESTs đƣợc tìm vùng lặp lại, từ xác định đƣợc 28.241 SSRs 190412 ESTs 19755 primers đƣợc thiết kế vùng flanking SSRs Các primers đƣợc kiểm tra lặp lại bắt cặp đặc hiệu BLAST Cơ sở liệu có 28241 trình tự SSRs đƣợc chuyển vào CSDL quan hệ tích hợp vào website BUILDING SSRs DATABASE of Citrus Sau đƣợc loại bỏ trình tự tạp, nhiễu dấu trình tự bào quan, trình tự lặp lại trình tự vector, trình tự ESTs đƣợc phân nhóm thành nhóm Contigs Singletons Việc nhóm trình tự giúp ích cho việc giảm bớt trình tự dƣ thừa, kéo dài EST-SSR xác định trình tự bảo tồn Kết thêm 1071 primers đƣợc thiết kế cho EST-SSR đƣợc kéo dài Ngoài ra, xác định đƣợc 33 EST-SSRs tƣơng đồng gene kháng virus Tristeza công cụ BLAST với ngƣỡng e-value = 10-10 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com v ABSTRACT LUU TRAN CONG HUY, NONG LAM UNIVERSITY, DATA MINING FOR DEVELOPING SIMPLE SEQUENCE REPEATS (SSR) MARKER IN EXPRESSED SEQUENCE TAGS (ESTs) FROM CITRUS Supervisor: Dr Trần Thị Dung Bsc Lƣu Phúc Lợi The research was carried out at the department of biotechnology at Nong Lam University Recent advances in genomic technologies have generated a vast amount of publicly available expressed sequence tags (ESTs) in Citrus These data can be mined to identify Simple sequence repeats (SSRs) or microsatellites These SSRs are useful because of a broad range of application, such as genome mapping and characterization, phenotype mapping, marker assisted selection of plant breeding, additional map-based cloning of important genes Moreover, this method of developing SSR marker from ESTs is inexpensive comparing to the traditional methods Methodology 1) We used perl script to receive EST sequences from database NCBI 2) Finded and separated SSRs include in ESTs database 3) We were learning about relationship database model to used to saved nucleotide, SSRs citrus sequences data and created database contain them 4) Finding SSR which are homologous with tristeza virus resistance gene 5) Designed web that contain database control software to share information with users Results: 28,241 SSR-containing ESTs (EST-SSRs) were identified by analyzing 191,110 ESTs sequences belonging to Citrus in dbEST division of GenBank 19,755 primers, which were filtered with repetition checking and BLAST checking, LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com vi were designed in flanking regions of SSRs These data were put into relational database and integrated SSR finder tool into the BUILDING SSRs DATABASE of Citrus Website After cleaning, masking repeat, vector and organelle sequences, the EST-SSR sequences and the related EST sequences without SSRs were assembled into contigs and singletons, to reduce redundancy, to enlarge EST-SSRs for primer designed and to develop consensus sequences As a result, more 1071 primers were design for these enlarged EST-SSRs Using a stringent BLAST search with a threshold e-value = 10-10 against typical pathogen resistance gene database in Citrus, we identified 33 EST-SSRs which are homologous with tristeza virus resistance gene LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com vii Mục Lục LỜI CẢM ƠN iii TĨM TẮT KHỐ LUẬN iv ABSTRACT vi DANH SÁCH CÁC TỪ VIẾT TẮT xi Chƣơng MỞ ĐẦU 1.1 Đặt vấn đề 1.2.Mục tiêu khóa luận Chƣơng TỔNG QUAN TÀI LIỆU 2.1 Giớ thiệu chi cam chanh 2.1.1 Vị trí phân lọai 2.1.2 Đặc điểm 2.1.3 Sâu hại bệnh tật 2.2 EST 2.3.1 Sơ lƣợc EST 2.3.2 Nguồn gốc EST 2.3.Sơ lƣợc phƣơng pháp Microsatellite (SSR) 2.3.1Những khái niệm kỹ thuật microsatellite 2.3.2 Giới thiệu chung 2.3.2.1 Tính chất 2.3.2.2 Khuếch đại microsatellites 10 2.3.2.3 Những giới hạn microsatellite 11 2.3.3 Các loại microsatellite 12 2.3.4 Cơ chế hình thành microsatellite 12 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com viii 2.3.5 Vai trò microsatellite 13 2.4 Phƣơng pháp xác định microsatellite truyền thống 15 2.5 Phƣơng pháp phát microsatellite sử dụng 16 2.6 Ứng dụng 18 2.7 Cơ sở liệu sinh học 18 2.7.1 NCBI 19 2.7.1.1 Vài nét NCBI 19 3.1.1.2 Một số sở liệu NCBI 19 Chƣơng 20 VẬT LIỆU VÀ PHƢƠNG PHÁP 20 3.1 Các chƣơng trình ngơn ngữ lập trình đƣợc sử dụng 20 3.1.1 Hệ điều hành 20 3.1.2 Các chƣơng trình phân tích trình tự 20 3.1.2.1 Chương trình Perl ssrfinder_1 20 3.1.2.2 Chƣơng trình tìm kiếm trình tự tƣơng đồng – BLAST 22 3.1.2.3 Hệ trị CSDL quan hệ Microsoft ACEESS 23 3.1.2.4 Egassembler 23 3.1.3 Apache web Server 24 3.4 CÁC BƢỚC TIẾN HÀNH 25 Chƣơng 37 KẾT QUẢ VÀ THẢO LUẬN 37 4.1 Thu thập trình tự ESTs Citrus từ CSDL dbEST 37 4.2 Loại liệu nhiễu dƣ công cụ EGassembler bao gồm bƣớc sau: 38 4.2.1 Làm trình tự 38 4.2.2 Dấu vùng trình tự nhiễu vector adaptors 39 4.2.3 Dấu vùng trình tự nhiễu bào quan 39 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ix 4.3 Assembling 41 4.4 Tìm SSR: SSRFinder v1.0 Steven Schroeder 42 4.4.1 BLASTn: 43 4.5.Thiết kế kiểm tra primer 45 4.6 tBLASTx 48 4.7 Đƣa tất liệu vào CSDL quan hệ Microsoft ACCESS để dễ dàng truy xuất thông tin 49 4.8 Tích hợp CSDL vừa xây dựng vào web thông qua Apache Server để chia thông tin qua mạng 49 4.8.1 Trang chủ (HOME PAGE) 49 4.8.2 Trang sở liệu SSRs (SSRs PAGE) 50 Chƣơng5 52 KẾT LUẬN VÀ ĐỀ NGHỊ 52 5.1 Kết luận 52 5.2 Đề nghị 53 TÀI LIỆU THAM KHẢO 54 Phụ Lục 57 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com x DANH SÁCH CÁC TỪ VIẾT TẮT BLAST Basic Local Alignment Search Tool CGI Common Gateway Interface CSDL Cơ sở liệu DBD Database Driver DBI Database Interface DNA deoxyribonucleic acid EST Expressed Sequence Tag HTML Hypertext Markup Language HTTP Hypertext Transfer Protocol NCBI the National Center for Biotechnology Information NIG the National Institute of Genetics NIH the National Institutes of Health NLM the Nation Library of Medicine Perl Practical Extraction and Report Language PHP Hypertext Preprocessior RDBMS Relational Database Management System SNP Single Nucleotide Polymorphism SSCP Single- Strand Conformation Polymorphism SSR Simple Sequence Repeats STS Sequence Tagged Site LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 45 Chúng phân lập thêm đƣợc lƣợng lớn trình tự EST từ trình tự EST khơng thể thiết kế mồi ban đầu từ phân lập thiết kế thêm đƣợc 1071 primer SSR 4.5.Thiết kế kiểm tra primer Thiết kế primer Bảng 4.8 Tổng số primer thiết kế đƣợc Citrus aurantium (Seville orange) 413 Primers Citrus clementina 9608 Primers Citrus jambhiri (jambhiri orange) 69 Primers Citrus macrophylla (colo) 70 Primers Citrus reticulata x Citrus temple 97 Primers Citrus reticulata (tangerine) 352 Primers Citrus sinensis (apfelsine/navel orange) 8463 Primers Citrus unshiu (Satsuma orange) 171 Primers Citrus x paradisi (grapefruit) 1420 Primers Citrus sinensis x Poncirus trifoliata (Carrizo citrange) 94 Primers Citrus x paradisi x Pondcirus trifoliata 834 Primers Kiểm tra primer Bảng 4.9 Tổng số Primer lại sau kiểm tra Citrus aurantium (Seville orange) 391 Primers Citrus clementina 9181 Primers Citrus jambhiri (jambhiri orange) 67 Primers Citrus macrophylla (colo) 70 Primers Citrus reticulata x Citrus temple 94 Primers Citrus reticulata (tangerine) 348 Primers Citrus sinensis (apfelsine/navel orange) 8242 Primers Citrus unshiu (Satsuma orange) 168 Primers Citrus x paradisi (grapefruit) 1396 Primers Citrus sinensis x Poncirus trifoliata (Carrizo citrange) 86 Primers Citrus x paradisi x Pondcirus trifoliata 783 Primers Sau thiết kế kiểm tra primer xác định đƣợc 19,755 cặp mồi đạt yêu cầu đặt ra.So với tỉ lệ SSR ban đầu tỉ lệ trình tự thiết kế mồi cao LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 46 Hình 4.6: Bảng so sánh lƣợng Primers trƣớc sau kiểm tra LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 47 Hình 4.7: Bảng so sánh tổng trình tự SSRs Primers thiết kế đƣợc LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 48 Chúng xác định đƣợc lƣợng lớn cặp mồi đủ điều kiện đặt Đa số SSR tìm đƣợc thiết kế mồi 4.6 tBLASTx Chúng xác định đƣợc 33 EST-SSRs tƣơng đồng gene kháng virus Tristeza công cụ BLAST với ngƣỡng e-value = 10-10 Bảng 4.10 Các trình tự tƣơng đồng với gene kháng virus tristeza Mã số CX052406.1a CN182797.1a DN799259.1a CV718404.1a Contig1678a CX290096.1a DR908292.1a DN620117.1a CX053145.1a V715355.1a DY302690.1a DY293832.1a DY284674.1 DY269563.1a Contig1685a DY304067.1a DY301664.1a DY294592.1a DY267783.1a DY265810.1a DY263066.1a CX078270.1a CX052405.1a CX070771.1a CN182794.1a CV719546.1a DY276141.1b CV719898.1a DN958924.1a CV714983.1 BQ624932.1a DY279874.1 Lòai Citrus sinensis Citrus sinensis Citrus reticulata x Citrus sinensis Citrus sinensis Citrus clementina Citrus sinensis Citrus sinensis Citrus sinensis Citrus sinensis Citrus clementina SSR ACACACACACAC Motif AC AGAGAGAGAGAG AG AGAAGAAGAAGA AGA AGCAGCAGCAGC ATAATAATAATA ACCACCACCACC AGC ATA ACC Citrus clementina ATCATCATCATCATC ATC Citrus sinensis Citrus sinensis Citrus sinensis TATATATATATA TGTGTGTGTGTG TCATCATCATCA TA TG TCA Citrus sinensis Citrus clementina Citrus sinensis Citrus x paradisi Citrus sinensis Citrus sinensis Citrus clementina TGGTGGTGGTGG TCGTCGTCGTCG CCTCCTCCTCCT TGG TCG CCT CCACCACCACCA CGACGACGACGA CGACGACGACGA CCA CGA CGA LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 49 CX296075.1a Citrus sinensis Poncirus trifoliata x TCTCTCTCTCTCTCTC TCTC Các ESTs-SSRs tƣơng đồng gene kháng virus Tristeza chủ yếu đƣợc phát hai loài Citrus Clementina Citrus Sinensis lƣợng trình tự EST-SSRs lớn (hình 4.1) Ở lịai khác số lƣợng ESTs đƣợc giải mã khơng nhiều nên chƣa tìm đƣợc ESTs-SSRs tƣơng đồng gene kháng virus Tristeza 4.7 Đƣa tất liệu vào CSDL quan hệ Microsoft ACCESS để dễ dàng truy xuất thơng tin Hình 4.8 : Mối quan hệ bảng 4.8 Tích hợp CSDL vừa xây dựng vào web 4.8.1 Trang chủ (HOME PAGE) Hình 4.9: Tổng quan Website LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 50 Nội dung trang web: Gồm lựa chọn để liên kết đến trang web chứa thông tin sở liệu khác 4.8.2 Trang sở liệu SSRs (SSRs PAGE) Nội dung trang web: Chứa sở liệu trình tự microsatellite chi cam chanh (citrus) gồm có: Thể tất sở liệu SSRs (All): loại SSRs đƣợc thể hiện, không đƣợc phân loại Hình thức thể hiện: Hình 4.10 Trang sở liệu SSRs (All) Tìm kiếm trình tự cần thiết: Tìm kiếm theo “StrainId” “MotifLengthGroup”: Khi ngƣời dùng quan tâm đến nhóm microsatellite Bảng 4.11: Các nhóm Strain id có sở liệu StrainID ST01 ST02 ST03 ST04 ST05 ST06 Name Citrus clementina Citrus sinensis Citrus jambhiri Citrus aurantium Citrus macrophylla Citrus reticulata LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 51 ST07 Citrus sinensis x Poncirus trifoliata ST08 Citrus unshiu ST09 Citrus x paradisi ST10 Citrus reticulata x Citrus temple ST11 Citrus x paradisi x Pondcirus trifoliata Bảng 4.12 Các nhóm Motif sở liệu Motif Length Motif Length Group ID Group Dimer Trimer Tetramer Pentamer Hexamer Heptamer Octamer Nonamer 10 Decamer 72 Dodecamer Hình thức thể hiện: Description Dinucleotide SSR Trinucleotide SSR Tetranucleotide SSR Pentanucleotide SSR Hexanucleotide SSR Heptanucleotide SSR Octanucleotide SSR Nonanucleotide SSR Decanucleotide SSR Dodecamer SSR Hình 4.11 Trang sở liệu SSRs chọn lọc theo Strain Id “ST01” “Motif Length Group ID” LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 52 Chƣơng KẾT LUẬN VÀ ĐỀ NGHỊ 5.1 Kết luận Đề tài gồm bƣớc đƣợc thực lần lƣợt nhằm mục đích xác định cách xác SSRs thiết kế mồi cho SSR Chúng tơi tải đƣợc 191,110 trình tự ESTs chi Citrus bao gồm 11 loài khác nhau, tiến hành loại nhiễu Egassembler lọai bỏ đƣợc 1725 trình tự ESTs khơng phù hợp u cầu Tiến hành Assembly Các trình tự ESTs vừa thu nhận đƣợc Egassembler thu nhận đƣợc 24278 Contigs Blast trình tự ESTs khơng thể thiết kế mồi Contigs phân lập đƣợc thêm 7635 ESTs 28241 trình tự SSRs đƣợc phân lập nhờ Perl script từ sở liệu ESTs ban đầu Kiểm tra thiết kế mồi cho SSRs tìm đƣợc, chúng tơi xác định đƣợc 19,755 cặp mồi Tiến hành Blast sở liệu gen kháng virus tristeza xác định đƣợc 33 ESTs-SSRs có motif tƣơng đồng với motif gen kháng virus Tích hợp tất sở liệu thu nhận đƣợc vào website SSRs Database of Citrus Trang Web sở liệu gồm có trang chính, HOME, Citrus, ABOUT SSRs, SSRs, TOOLS, ABOUT US, Other Links Ngoài ra, từ trang web cịn kết nối đến trang phụ khác để cung cấp tiện ích cho ngƣời dùng Từ trang web này, ngƣời sử dụng truy xuất thơng tin LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 53 Về tìm, thu nhập phân lập hầu hết ESTs-SSRs chi cam chanh đƣợc công bố NCBI 5.2 Đề nghị Nên cập nhật sở liệu theo định kỳ lƣợng trình tự đƣợc giải mã công bố ngày nhiều để đảm bào tính cấp bách phong phú Website Mở rộng sở liệu sang chi, lòai khác nhằm phục vụ cho nhu cầu nghiên cứu tìm hiểu Cần thiết lập thêm bẫy lỗi đƣợc trình bày bƣớc để đảm bảo việc hạn chế trùng lắp liệu không cần thiết nhập Xây dựng nhiều trang web chứa thơng tin tìm kiếm công cụ (assembly, thiết kế primer, enzyme cắt giới hạn, xây dựng mơ hình cấu trúc,…) phục vụ cho việc khai thác thông tin ứng dụng khác Tiến hành thiết kế mồi chung phục vụ cho phản ứng PCR phân biệt loài họ họ thông qua trang web thiết kế primer trực tuyến Internet nhƣ GeneFisher, Primer3,… hay xây dựng trang web chứa công cụ phục vụ cho thiết kế primer nhƣ GPRIME, Primer3,…kết hợp với ngôn ngữ lập trình Perl LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 54 Chƣơng TÀI LIỆU THAM KHẢO TÀI LIỆU TIẾNG VIỆT Trần Nguyễn Minh Đăng, 2005 XÂY DỰNG CƠ SỞ DỮ LIỆU SSRS (SIMPLE SEQUENCE REPEATS) TỪ ESTS (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Khóa luận tốt ngiệp Ngành Công nghệ sinh học, Đại học Nông lâm TP Hồ Chí Minh Nguyễn Minh Đạo, 2002 MS-Access 2000 Trƣờng đại học Sƣ Phạm Kỹ Thuật, khoa Công Nghệ Thơng Tin Nguyễn Thị Lang – Bùi Chí Bửu, 2005 Sinh học phân tử Giới thiệu phương pháp ứng dụng Nhà xuất nông nghiệp TP HCM Bùi Huy Quỳnh, 2002 Front Page 2000 Trƣờng đại học Sƣ Phạm Kỹ Thuật, khoa Công Nghệ Thông Tin Nguyễn Trƣờng Sinh – Lê Minh Hoàng – Hoàng Đức Hải, 2003 Thực hành JavaScript (cho web) Nhà xuất Thống Kê Nguyễn Văn Thái, 2005 Xây dựng sở liệu hai gene Hsp-70 Reverse Transcripte-Rnaseh số lồi virus thực vật Khóa luận tốt ngiệp Ngành Công nghệ sinh học, Đại học Nông lâm TP Hồ Chí Minh Nguyễn Kỳ Trung – Lê Thành Trung, 2005 Thu thập tổ chức liệu gene phục vụ nghiên cứu trồng biến đổi di truyền Khóa luận tốt ngiệp Ngành Cơng nghệ sinh học, Đại học Nơng lâm TP Hồ Chí Minh TÀI LIỆU NƢỚC NGOÀI 8.Acquadro A., Lee D., Donini P., Portis E., Comino C., Saba E., Lanteri S., 2003 Microsatellite Amplified Library (MAL): an alternative approach for STMS isolation Bologna – Italy 9.Ali Masoudi-Nejad, Ruy Jauregui, Shuichi Kawashima, Susumu Goto, Minoru Kanehisa, Takashi R Endo, 1999.The kingdom of Plantae EST Indices: a resource for plant genomics community 10.Altschul, Stephen F., Thomas L Madden, Alejandro A Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res 25:3389-3402 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 55 11.Andrew J Robinson , Christopher G Love , Jacqueline Batley ,Gary Barker and David Edwards, 2004 Simple sequence repeat marker loci discovery using SSR primer 12.Andrew Salywon, Matthew Barber, Nathan Herling, and William Stewart 2005 Data mining for microsatellites in expressed sequence tags (ESTs) from arabidopsis thaliana and brassica species (brassicaceae) 13.A Story Book Future for Lesquerella? Agricultural Research Magazine (1999) November Benson, G, 1999 Tandem repeats finder: a program to analyze DNA sequences Nucleic Acids Res 27, 573–580 14.Castelo, A.T et al., 2002 Troll – Tandem Repeat Occurrence Locator Bioinformatics 18, 634–636 Huang, X and Madan, A., 1999 CAP3: A DNA sequence assembly program Genome Research, 6: 829–845 15.Edward F Gilman, 1999 Ananas comosus University of Florida Jorge A Da Silva , Nora Solis-Gracia, 2003.Tagging resistance genes with sugarcane estderived microsatellites 16.Huang, X and Madan, A., 1999 CAP3: A DNA sequence assembly program Genome Research, 6: 829–845 17.Kantety, R.V., M.L Rota, D.E Mathews, and M.E Sorrells, 2002 Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat Plant Mol Biol Rep 48:501-510 18.K.D Scott, Microsatellites Derived from ESTs and their Comparison with those Derived by Other Methods Centre for Plant Conservation Genetics, Southern Cross University, Lismore, Australia 19.Morgante M., Hanafey M., and Powell W, 2002 Microsatellites are preferentially associated with non repetitive DNA in plant genomes Nature Genetics 30:194-200 20.Morgante, M and Olivieri, A.M., 1993 PCR-amplified microsatellites as markers in plant genetics Plant J 3, 175–182 21.Morgante, M et al., 2002 Microsatellites are preferentially present with nonrepetitive DNA in plant genomes Nat Genet 30, 194–200 22.P K Gupta, H S Balyan, P C Sharma and B Ramesh, 2000.Microsatellites in plants: A new class of molecular markers LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 56 23.Rozen, S., Skaletsky, H "Primer3 on the WWW for general users and for biologist programmers." In S Krawetz and S Misener, eds Bioinformatics Methods and Protocols in the series Methods in Molecular Biology Humana Press, Totowa, NJ, 2000, pages 365-386 Code available at http://fokker.wi.mit.edu/primer3/ 24.Ramesh V Kantety, Mauricio La Rota, David E Matthews and Mark E Sorrells, 2002 Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat Kluwer Academic Publishers 25.Win Hide, Rob Miller, Andrey Ptitsyn, Janet Kelso, Chellapa Gopallakrishnan and Alan Christoffels, 1999 EST Clustering Tutorial TÀI LIỆU TỪ CÁC TRANG WEB: 26.< http://210.212.212.7:9999/PHP/SILKSAT/index.php?f=protocol_ssr > 27 29.< http://vi.wikipedia.org/wiki/ chi cam chanh > 30. 32.< http://www.maizemap.org/bioinformatics/SSRFINDER/ > 33.< http://www.ncbi.nlm.nih.gov/About/primer/est.html > 34.< http://www.ncbi.nlm.nih.gov/BLAST/download.shtml > 35.< http://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml > 36.< http://www.ncbi.nlm.nih.gov/BLAST/full_options.html > 37.< http://www.ncl-india.org/ssr/ssr.htm > 38.< http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results.cgi > 39.< http://www.tc.cornell.edu/WBA/ > LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 57 Phụ Lục Trang thông tin Citrus (Citrus PAGE) Nội dung trang web: Giới thiệu cách tổng quát chi cam chanh citrus Tổng quan Citrus Trang thông tin microsatellite (ABOUT SSRs PAGE) Nội dung trang web: Giới thiệu chung phƣơng pháp microsatellite Trang Microsatellites Trang tích hợp cơng cụ để tìm kiếm SSR LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 58 Dùng để tìm trình tự microsatellite sở liệu website, kết hiển thị kết đoạn SSR tìm đƣợc Trang web tìm kiếm trình tự microsatellite mã số truy cập Trang web tìm kiếm trình tự microsatellite Motif LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 59 Trang cơng cụ Trang tích hợp cơng cụ để tìm kiếm SSR Dùng để tìm trình tự microsatellite từ trình tự hay upload file định dạng FASTA, kết hiển thị kết đoạn SSR tìm đƣợc Trang web tìm kiếm trình tự microsatellite Tuy nhiên, Website dần đƣợc hồn thiện để thức đƣa vào sử dụng trực tuyến LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ... TẮT KHỐ LUẬN LƢU TRẦN CƠNG HUY, Đại Học Nơng Lâm TP Hồ Chí Minh, tháng 07/2007 ? ?KHAI THÁC DỮ LIỆU ESTs (EXPRESSED SEQUENCE TAGs) Ở CHI CAM CHANH (CITRUS) CHO VIỆC PHÁT TRIỂN MARKER PHÂN TỬ SSR (SIMPLE... (EXPRESSED SEQUENCE TAGs) Ở CHI CAM CHANH (CITRUS) CHO VIỆC PHÁT TRIỂN MARKER PHÂN TỬ SSR (SIMPLE SEQUENCE REPEATS)” đƣợc thực với mục tiêu lần lƣợt nhƣ sau: Thu nhận trình tự EST chi cam chanh từ... Tìm hiểu mơ hình liệu quan hệ, sử dụng mơ hình vào việc lƣu trữ liệu trình tự nucleotide trình tự SSRs chi cam chanh (Citrus), tạo sở liệu chứa trình tự Sau đƣa liệu vào sở liệu 5) Trang web