Đƣa tất cả các dữ liệu này vào CSDL quan hệ Microsoft ACCESS để dễ dàng

Một phần của tài liệu Khai thác dữ liệu ESTs ở chi cam chanh cho việc phát triển marker phân tử SSR (Trang 61)

dàng truy xuất thông tin.

Hình 4.8 : Mối quan hệ giữa các bảng 4.8 Tích hợp CSDL vừa xây dựng vào web

4.8.1 Trang chủ (HOME PAGE)

Nội dung trang web: Gồm các lựa chọn để liên kết đến các trang web chứa

thông tin và cơ sở dữ liệu khác.

4.8.2 Trang cơ sở dữ liệu SSRs (SSRs PAGE)

Nội dung của trang web: Chứa cơ sở dữ liệu trình tự microsatellite của chi

cam chanh (citrus) gồm có:

Thể hiện tất cả cơ sở dữ liệu SSRs (All): các loại SSRs sẽ đƣợc thể hiện, không đƣợc phân loại. Hình thức thể hiện:

Hình 4.10 Trang cơ sở dữ liệu SSRs (All) Tìm kiếm các trình tự cần thiết:

Tìm kiếm theo “StrainId” và “MotifLengthGroup”: Khi ngƣời dùng quan tâm đến từng nhóm microsatellite.

Bảng 4.11: Các nhóm Strain id có trong cơ sở dữ liệu

StrainID Name ST01 Citrus clementina ST02 Citrus sinensis ST03 Citrus jambhiri ST04 Citrus aurantium ST05 Citrus macrophylla ST06 Citrus reticulata

ST07 Citrus sinensis x Poncirus trifoliata

ST08 Citrus unshiu

ST09 Citrus x paradisi

ST10 Citrus reticulata x Citrus temple

ST11 Citrus x paradisi x Pondcirus trifoliata

Bảng 4.12 Các nhóm Motif trong cơ sở dữ liệu Motif Length Group ID Motif Length Group Description 2 Dimer Dinucleotide SSR 3 Trimer Trinucleotide SSR 4 Tetramer Tetranucleotide SSR 5 Pentamer Pentanucleotide SSR 6 Hexamer Hexanucleotide SSR 7 Heptamer Heptanucleotide SSR 8 Octamer Octanucleotide SSR 9 Nonamer Nonanucleotide SSR 10 Decamer Decanucleotide SSR 72 Dodecamer Dodecamer SSR Hình thức thể hiện:

Hình 4.11 Trang cơ sở dữ liệu SSRs chọn lọc theo Strain Id “ST01” và “Motif Length Group ID” là 3

Chƣơng 5

KẾT LUẬN VÀ ĐỀ NGHỊ

5.1. Kết luận

Đề tài gồm 7 bƣớc đƣợc thực hiện lần lƣợt nhằm mục đích xác định 1 cách chính xác các SSRs và thiết kế mồi cho SSR đó

Chúng tôi đã tải đƣợc 191,110 trình tự ESTs của chi Citrus bao gồm 11 loài khác nhau, tiến hành loại nhiễu bằng Egassembler lọai bỏ đƣợc 1725 trình tự ESTs không phù hợp yêu cầu.

Tiến hành Assembly Các trình tự ESTs vừa thu nhận đƣợc bằng Egassembler chúng tôi thu nhận đƣợc 24278 Contigs.

Blast các trình tự ESTs không thể thiết kế mồi trên các Contigs phân lập đƣợc thêm 7635 ESTs mới

28241 trình tự SSRs đƣợc phân lập nhờ Perl script từ cơ sở dữ liệu ESTs ban đầu

Kiểm tra thiết kế mồi cho các SSRs mới tìm đƣợc, chúng tôi xác định đƣợc 19,755 cặp mồi

Tiến hành Blast trên cơ sở dữ liệu gen kháng virus tristeza xác định đƣợc 33 ESTs-SSRs có các motif tƣơng đồng với motif của gen kháng virus

Tích hợp tất cả các cơ sở dữ liệu thu nhận đƣợc vào website SSRs Database of Citrus

Trang Web cơ sở dữ liệu gồm có 7 trang chính, đó là HOME, Citrus, ABOUT SSRs, SSRs, TOOLS, ABOUT US, Other Links. Ngoài ra, từ những trang web chính này còn có thể kết nối đến những trang phụ khác để cung cấp những tiện ích cho ngƣời dùng. Từ các trang web này, ngƣời sử dụng có thể truy xuất thông tin.

Về cơ bản chúng tôi đã tìm, thu nhập và phân lập hầu hết các ESTs-SSRs của chi cam chanh đã đƣợc công bố trên NCBI

5.2. Đề nghị

Nên cập nhật cơ sở dữ liệu theo định kỳ vì lƣợng trình tự đƣợc giải mã và công bố ngày càng nhiều để đảm bào tính cấp bách và phong phú của Website

Mở rộng cơ sở dữ liệu sang các chi, các lòai khác nhằm phục vụ cho nhu cầu nghiên cứu và tìm hiểu

Cần thiết lập thêm các bẫy lỗi đƣợc trình bày ở bƣớc 7 để đảm bảo hơn việc hạn chế trùng lắp dữ liệu không cần thiết khi nhập.

Xây dựng nhiều trang web chứa các thông tin tìm kiếm và công cụ (assembly, thiết kế primer, enzyme cắt giới hạn, xây dựng mô hình cấu trúc,…) phục vụ cho việc khai thác thông tin và các ứng dụng khác.

Tiến hành thiết kế mồi chung phục vụ cho phản ứng PCR phân biệt các loài trong họ và giữa các họ thông qua các trang web thiết kế primer trực tuyến trên Internet nhƣ GeneFisher, Primer3,… hay xây dựng trang web chứa công cụ phục vụ cho thiết kế primer nhƣ GPRIME, Primer3,…kết hợp với ngôn ngữ lập trình Perl.

Chƣơng 6

TÀI LIỆU THAM KHẢO

TÀI LIỆU TIẾNG VIỆT

1. Trần Nguyễn Minh Đăng, 2005. XÂY DỰNG CƠ SỞ DỮ LIỆU SSRS (SIMPLE

SEQUENCE REPEATS) TỪ ESTS (EXPRESSED SEQUENCE TAGS) CỦA

CÂY DỨA (Ananas comosus). Khóa luận tốt ngiệp Ngành Công nghệ sinh học, Đại học Nông lâm TP Hồ Chí Minh.

2. Nguyễn Minh Đạo, 2002. MS-Access 2000. Trƣờng đại học Sƣ Phạm Kỹ Thuật, khoa Công Nghệ Thông Tin.

3. Nguyễn Thị Lang – Bùi Chí Bửu, 2005. Sinh học phân tử. Giới thiệu phương pháp và ứng dụng. Nhà xuất bản nông nghiệp TP. HCM.

4. Bùi Huy Quỳnh, 2002. Front Page 2000. Trƣờng đại học Sƣ Phạm Kỹ Thuật, khoa Công Nghệ Thông Tin.

5. Nguyễn Trƣờng Sinh – Lê Minh Hoàng – Hoàng Đức Hải, 2003. Thực hành JavaScript (cho web). Nhà xuất bản Thống Kê.

6. Nguyễn Văn Thái, 2005. Xây dựng cơ sở dữ liệu hai gene Hsp-70 và Reverse Transcripte-Rnaseh ở một số loài virus thực vật. Khóa luận tốt ngiệp Ngành Công nghệ sinh học, Đại học Nông lâm TP Hồ Chí Minh.

7. Nguyễn Kỳ Trung – Lê Thành Trung, 2005. Thu thập và tổ chức dữ liệu gene phục vụ nghiên cứu cây trồng biến đổi di truyền. Khóa luận tốt ngiệp Ngành Công nghệ sinh học, Đại học Nông lâm TP Hồ Chí Minh.

TÀI LIỆU NƢỚC NGOÀI

8.Acquadro A., Lee D., Donini P., Portis E., Comino C., Saba E., Lanteri S., 2003.

Microsatellite Amplified Library (MAL): an alternative approach for STMS isolation. Bologna – Italy.

9.Ali Masoudi-Nejad, Ruy Jauregui, Shuichi Kawashima, Susumu Goto, Minoru Kanehisa, Takashi R. Endo, 1999.The kingdom of Plantae EST Indices: a resource for plant genomics community

10.Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402.

11.Andrew J. Robinson , Christopher G. Love , Jacqueline Batley ,Gary Barker and David Edwards, 2004. Simple sequence repeat marker loci discovery using SSR primer.

12.Andrew Salywon, Matthew Barber, Nathan Herling, and William Stewart. 2005. Data mining for microsatellites in expressed sequence tags (ESTs) from arabidopsis thaliana and brassica species (brassicaceae).

13.A Story Book Future for Lesquerella? Agricultural Research Magazine. (1999) November. Benson, G, 1999. Tandem repeats finder: a program to analyze DNA sequences. Nucleic Acids Res. 27, 573–580.

14.Castelo, A.T. et al., 2002. Troll – Tandem Repeat Occurrence Locator. Bioinformatics 18, 634–636. Huang, X. and Madan, A., 1999. CAP3: A DNA sequence assembly program. Genome Research, 6: 829–845.

15.Edward F. Gilman, 1999. Ananas comosus. University of Florida. Jorge A. Da Silva , Nora Solis-Gracia, 2003.Tagging resistance genes with sugarcane est- derived microsatellites.

16.Huang, X. and Madan, A., 1999. CAP3: A DNA sequence assembly program. Genome Research, 6: 829–845.

17.Kantety, R.V., M.L. Rota, D.E. Mathews, and M.E. Sorrells, 2002. Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat. Plant. Mol. Biol. Rep. 48:501-510.

18.K.D. Scott, Microsatellites Derived from ESTs and their Comparison with those Derived by Other Methods. Centre for Plant Conservation Genetics, Southern Cross University, Lismore, Australia.

19.Morgante M., Hanafey M., and Powell W, 2002. Microsatellites are preferentially associated with non repetitive DNA in plant genomes. Nature Genetics . 30:194-200.

20.Morgante, M. and Olivieri, A.M., 1993. PCR-amplified microsatellites as markers in plant genetics. Plant J. 3, 175–182.

21.Morgante, M. et al., 2002 Microsatellites are preferentially present with non- repetitive DNA in plant genomes. Nat. Genet. 30, 194–200.

22.P. K. Gupta, H. S. Balyan, P. C. Sharma and B. Ramesh, 2000.Microsatellites in plants: A new class of molecular markers.

23.Rozen, S., Skaletsky, H. "Primer3 on the WWW for general users and for biologist programmers." In S. Krawetz and S. Misener, eds. Bioinformatics Methods and Protocols in the series Methods in Molecular Biology. Humana Press, Totowa, NJ, 2000, pages 365-386. Code available at http://fokker.wi.mit.edu/primer3/

24.Ramesh V. Kantety, Mauricio La Rota, David E. Matthews and Mark E. Sorrells, 2002. Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat. Kluwer Academic Publishers. 25.Win Hide, Rob Miller, Andrey Ptitsyn, Janet Kelso, Chellapa Gopallakrishnan

and Alan Christoffels, 1999. EST Clustering Tutorial.

TÀI LIỆU TỪ CÁC TRANG WEB:

26.< http://210.212.212.7:9999/PHP/SILKSAT/index.php?f=protocol_ssr > 27. <http://en.wikipedia.org/wiki/Expressed_sequence_tag

28.< http://vi.wikipedia.org/wiki/FASTA >

29.< http://vi.wikipedia.org/wiki/ chi cam chanh >

30.<http://egassembler.hgc.jp/cgibin/eassembler4.cgi?pmode=help 31.< http://www.fsl.orst.edu/tgerc/PCRCourse/lecture_2.htm > 32.< http://www.maizemap.org/bioinformatics/SSRFINDER/ > 33.< http://www.ncbi.nlm.nih.gov/About/primer/est.html > 34.< http://www.ncbi.nlm.nih.gov/BLAST/download.shtml > 35.< http://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml > 36.< http://www.ncbi.nlm.nih.gov/BLAST/full_options.html > 37.< http://www.ncl-india.org/ssr/ssr.htm > 38.< http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results.cgi > 39.< http://www.tc.cornell.edu/WBA/ >

Phụ Lục

Trang thông tin về Citrus (Citrus PAGE)

Nội dung của trang web: Giới thiệu một cách tổng quát về chi cam chanh citrus

.

Tổng quan về Citrus

Trang thông tin về microsatellite (ABOUT SSRs PAGE)

Nội dung của trang web: Giới thiệu chung về phƣơng pháp microsatellite

Trang Microsatellites

Dùng để tìm trình tự microsatellite trong cơ sở dữ liệu của website, kết quả sẽ hiển thị kết quả đoạn SSR tìm đƣợc

Trang web tìm kiếm trình tự microsatellite bằng mã số truy cập

Trang công cụ

Trang tích hợp công cụ để tìm kiếm SSR

Dùng để tìm trình tự microsatellite từ một trình tự bất kỳ hay upload file ở định dạng FASTA, kết quả sẽ hiển thị kết quả đoạn SSR tìm đƣợc.

Trang web tìm kiếm trình tự microsatellite

Tuy nhiên, Website đang dần đƣợc hoàn thiện để có thể chính thức đƣa vào sử dụng trực tuyến.

Một phần của tài liệu Khai thác dữ liệu ESTs ở chi cam chanh cho việc phát triển marker phân tử SSR (Trang 61)

Tải bản đầy đủ (PDF)

(71 trang)