Xây dựng mô hình và công cụ tin học để xử lí thông tin về gen hỗ trợ nghiên cứu ứng dụng trong công nghệ sinh học tại việt nam

184 0 0
Xây dựng mô hình và công cụ tin học để xử lí thông tin về gen hỗ trợ nghiên cứu ứng dụng trong công nghệ sinh học tại việt nam

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

a CNIT 2e ỦY BAN NHẦN DẦN TP HỒ CHÍ MINH SỞ KHOA HỌC CÔNG NGHỆ VÀ MÔI TRƯỜNG ===O==-= BAO CAO KET QUA Đề tài: XÂY DỤNG MƠ HÌNH VÀ CÔNG CỤ TIN HỌC ĐỂ XỬ LÝ THÔNG TIN VỀ GEN, HỖ TRỢ NGHIÊN CỨU ỨNG DỤNG TRONG CÔNG NGHỆ SINH HỌC TAI VIET NAM Chủ nhiệm đề tài: | Đồng chủ nhiệm: GS.TSKH Hoàng Văn Kiếm PGS TS Nguyễn Văn Uyển Cơ quan chủ trì Trung tâm Phát triển Công nghệ Thông tin, ĐHQG-HCM TP.HCM, Tháng năm 2001 V-1 DANH SÁCH NHỮNG NGƯỜI THAM GIA CHÍNH e GS.TSKH Hoàng Văn Kiếm, Trung tâm Phát triển CNTT, ĐHQG- HCM e PGS TS Nguyén Van Uyển, Viện Sinh học Nhiệt đới se Th Sĩ Đỗ Phúc, Trung tâm Phát triển CNTT, ĐHQG-HCM e Kỹ sư Lê Tấn Đức, Viện Sinh học Nhiệt đới » CH Phạm Khắc Hậu, Trung tâm Phát triển CNTT, ĐHQG-HCM sCN Mai Tiến Dũng, Trung tâm Phát triển CNTT, ĐHQG-H CM CN Nguyễn Hồng Sơn, Trung tâm Phát triển CNTT, ĐHQG-H CM e Kỹ sư Phan Tường Lộc, Viện Sinh học Nhiệt đới e CN Nguyễn Thị Thanh, Viện Sinh học Nhiệt đới se BS Đỗ Văn Sơn, Trung tâm Khoa học-Nông nghiệp miền nam e CN Lê Anh Tài, Trung tâm Phát triển CNTT, ĐHQ G-HCM eCN Nguyễn Thanh Tùng, Khoa CNTT, ĐHKHTN eCN Hồ Ngọc Bảo Quốc, Trung tâm Phát triển CNTT, ĐHQG-HCM ®CN Mai Thu Vân, Trung tâm Phát triển CNTT, ĐHQG-H CM MỤC LỤC Chương 1: Mở đầu Chương 2: Xây dựng WebSite Công nghệ Sinh học Thu thập thông tin 1.1 Thông tin CNSH từ Internet CSDL công cộng 1.2 Thông tin quan hoạt động lĩnh vực CNSH Việt nam 1.3 Các cơng trình nghiên cứu ứng dụng CNTT vào xử lý thong tin vé gen Xây dựng WebSite Công nghệ Sinh học 2.1 Trang tin tức 2.2 Trang tiém nang 2.3 Trang mục tiêu 2.4 Trang tổ chức 2.5 Trang ngân hàng liệu gen 2.6 Trang tin-sinh học 2.7 Trang xử lý thông tin di truyền Chương 3: Xây dựng phần mềm gen GENESYS2000 Thu thập tìm biểu phần mêm xử lý gen 1.1 Phần mềm DNASIS v2.5 1.2 Phần mềm VECTOR NTI 4.0 1.3 Nhận xét Xây dựng phần mêm 2.1 Giới thiệu GENESYS2000 2.2 Các chức phần mềm 2.2.1 Nhập trình tự ADN, Protein GENESYS2000 2.2.2 So sánh mức độ tương đồng hai trình tự ADN 2.2.3 So sánh mức độ tương đồng nhiều 2.2.4 Tạo dendrogram 2.2.5 Tìm 2.2.6.Vé enzyme trình tự ADN giới hạn ban d6 Plasmid 2.2.7 Thiết kế Primer cho phản ứng PCR 2.2.8 Tìm đoạn lặp phổ biến quan hệ chúng tập trình tự 2.2.9 Truy cập sở liệu gene qua sinh loài V-3 Chương 4: Ứng dụng phân mềm GENESYS2000 vào thực nghiệm sinh học Sử dụng phần mềm để nhập trình tự ADN tính tỉ lệ phần trăm Nucleotit trình tự ADN Xác định vị trí enzyme giới hạn vé ban dé plasmid để cấu trúc tái tổ hợp ADN tạo Plasmid chứa gene hữu dụng phục vụ việc chuyển gene vào trồng Sử dụng phần mềm thiết kế Primer để xác định trồng chuyển gen thông qua phản ứng PCR ( Polymerase Chain React ion ) Tài liệu tham khảo V-4 CHƯƠNG MỞ ĐẦU Sự phát triển nhanh chóng nghiên cứu sinh học thập niên sau kỷ 20 tạo số lượng kết khổng lô liên quan đến trình tự sinh học chức cửa gen, cấu trúc chức protein, tài nguyên đa dang sinh hoc CNTT da ứng dụng nhằm xếp, hệ thống hóa kết thành CSDL theo chuyên để cung cấp công cụ cho nhà nghiên cứu tồn giới để phân tích, dự báo, khai thác cách hữu hiệu kết có, giúp nhà nghiên cứu sinh học tiếp cận đối tượng nghiên cứu | , Nganh Sinh-Tin hoc(Bio-informatics) dudc hinh thành từ kết hợp Sinh học CNTT tạo CSDL liên quan đến mức nhiễm sắc thể (Genome Database, GDB), mức trình tự base gene (Genbank EMBL), mức trình tự protein (Swiss-Prot; PDB: protein database), mức sản phẩm biểu chức gene số đối tượng cụ thể (Søceharomyces cerevisiae Genome Database, SGD; Yeast Proteome Database, YPD) Các CSIDL truy cập qua Web hố trợ khả truy cập, phân tích khai thác thơng tin, điển CSDL EMBnet (European Molecular Biology Network: Infobiogen ) Các phần mềm tin học phát triển để hỗ trợ diễn dịch trình tự ADN thành trình tự amino acid, so sánh mức độ tương đồng cửa trình tự, xác định dự đốn chức gen protein Mặt khác, kết hợp cửa CNTT Sinh học hứa hẹn tạo đột phá tiến khoa học kỹ thuật: xây dựng mơ hình tốn-tin học sinh học mạng neural, thuật toán di truyền để giải toán khoa học, kỹ thuật, kinh tế, xã hội, tạo máy tính sinh học Các nghiên cứu cấu trúc, chức gene Việt nam giai đoạn khởi đầu tương lai, nghiên cứu lĩnh vực chắn phát triển mạnh Khi việc nghiên ứng dụng CNTT vào công nghệ gen yêu cầu bắt 1-1 buộc Mặt khác, nghiên cứu liên quan đến tài nguyên, đa dạng sinh học nói riêng sinh học CNSH Việt Nam nói chung phong phú, cần hệ thống hóa khai thác có hiệu Mặc dù vậy, nay, việc ứng dụng CNTT vào sinh học chưa quan tâm Xuất phát từ yếu tố trên, Trung tâm Phát triển Công nghệ ĐHQG-HCM Thong tin, phối hợp với Trung tâm Công nghệ Sinh học Nông nghiệp đăng ký với Sở Khoa học Công nghệ Môi trường TP.HCM đề tài: “Xây dựng mơ hình cơng cụ tin học để xử lý thông tin gen, hỗ trợ nghiên cứu ứng dụng công nghệ sinh học Việt nam ” Đề tài Hội đồng xét duyệt thơng qua ngày 30/7/1999 với nội dung sau đây: s_ Khai thác nghiên cứu e Thu thập xây dựng phần mềm tin học xử lý phân tích trình tự liệu thơng tin di truyền sinh học s_ Để xuất qui trình ứng dụng CNTT vào thực nghiệm sinh học để tạo chọn giống trồng Báo cáo kết qủa đề tài bao gồm nội dung kết công việc như: Thu thập khai thác thông tin e Thông tin tổ chức quan hoạt động lĩnh vực CNSH Việt nam ° Thơng tin Website CNSH ngồi nuớc »_ Các báo, cơng trình nghiên cứu ứng dụ ng CNTT vào CNSH se Nguồn liệu gen lấy từ Website CNSH công cộng đĩa CD, 2.Thiết kế xây dựng hệ thống thông tin Web e Internet CSDL Hệ thống thông tin cửa tổ chức quan hoạt động lĩnh vực CNSH Việt nam, 1-2 se CSDL ° Web chứa trình tự sinh học Site Cơng nghệ Sinh học Thu thập tìm hiểu chức số phần mềm xử lý trình tự sinh học Phần mềm DNASIS v2.5 Phần mềm NTI v4.0 VECTOR Xây dựng phần mềm xử lý trình tự sinh học GENESYS2000 Các chức cửa phần mềm xử lý trình tự GENESYS2000 Nhập trình tự ADN, Protein So sánh mức độ tương đồng hai nhiều trình tự ADN Tạo dendrogram Tìm Vẽ enzyme giới hạn Plasmid Thiết kế Primer cho phần ứng PCR Tìm đoạn lặp phổ biến quan hệ chúng tập trình tự Truy cập sở liệu gene qua sinh loài Ứng dụng phần mễm máy tính vào thực nghiệm sinh học Sử dụng phần mềm máy tính để xứ lý, phân tích trình tự sinh học Xác định vị tí enzyme giới hạn, vẽ đồ plasmid để cấu trúc tái tổ hợp DNA tạo plasmid chứa gene hitu dụng trồng phục vụ việc chuyển gcne vào Sử dụng phần mềm thiết kế Primer để xác định trồng chuyển gene thông qua phẳn ứng PCR, 1-3 CHUONG XÂY DỰNG WEBSITE CÔNG NGHỆ SINH HỌC THU THẬP THÔNG TIN Trong phần này, chúng tơi trình bày loại thơng tin nhóm để tài thu thập bao gồm thông tin địa trang Web quan trọng liên quan đến nghiên cứu Sinh-Tin học; nguồn liệu gen; thông tin quan hoạt động lĩnh vực CSSH Việt nam; báo cơng trình nghiên cứu liên quan đến để tài Các thông tin thu thập lấy từ Internet nguồn liệu công cộng, qua điều tra thu thập số liệu Các thông tin thu thập phân loại đưa vào trang Web CNSH nhóm để tài xây dựng 1.1 Thông tin CNSH từ Internet CSDL công cộng Với xuất INTERNET việc tăng cường ứng dụng CNTT vào phân tích xử lý gen, ngày có nhiều WebSite cơng nghệ sinh học để hỗ trợ cho CÔng tác nghiên cứu cơng nghệ sinh học tồn giới Ở Việt nam mạng Internet đầu tư phát triển để hổ trợ cho phát triển ngành nghề có cơng nghệ sinh học nhiên địa Website công nghệ Sinh học chưa phổ biến nên tiến hành thu thập địa chỉ: Website Quan trọng để phục vu cho nhà nghiên cứu công nghệ sinh học Việt nam dễ dàng có địa website 1.1.1 Địa Website cdc co quan nghiên cứu CNSH giới Chúng thu thập nhiều địa Websites quan nghiên cứu CNSH trÊn g1ới sau: ° Institute for Biotechnology Information : http://www.biotechinfo.com  The Genetics Forum: http://www.geneticsforum.org.uk đ Genetics Engneering News: http://www.genengnews.com ° The International Rice Research Institute (TRRI): 2-1 http://www.cgiar.org/itri/riceweb Information Systems for Biotechnology : http://www.nbia p.vt.edu National Agricultural Library : http://www.nal.usda.gov/bic International Service for National Agricultural Research : http://www cgiar.org.isnar Agricultural Biotechnology Center ( Hungary ):htt p://www.abc.hu Bioline's Online Journal Biosafe ty : http://www.bdt org.br/bioline/by DNA Bank at MAFF ( Japan) : http://bank.dna.affr e.go.jp International Centre for Genetic Engineering & Biotechnology(ICGEB ) _ http://base.icgeb.triesteit Technical Biochemistry : http :// www.itb.uni-stuttgart.de Expert Protein Analysis System ( The Swiss Instit ute of Bioinformatics ): http://www.expasy.ch/tools/ Danish Center for Human Genome Research: http: //biobase.dk/cgi-bin/celis Virus Vector & Gene Therapy: http://www.micro.msb.le.ac.uk/335/peel| html Plant Genome Data and Information Center : http://www.nal.usda.gov/pgdic/ Institute of Forest Genetics dendrome Projetct : http://dendrome.ucdavis.edu/ National Biotechnology Information Facility : http:/www nbif.org Biotechnology Industry Organization : http://www bio.org Center for Engineering Plants for Resistance agains t Pathogens (CEPRAP) http://www-ceprap.ucdavis.edu/ The Food Biotechnology Center : http://fabctr.umn.ed u Progressive Farmer Online-Biotechnology : http://ww.pathf inder.com Agricultural Genome Information System : http:⁄/probe.nalusda sov:8 000 2-2 | e Rice Genome Sequence Data ( Asia Usage): http://www.rice-research.org e Rice Genome Sequence data : http://www.rice-research.or e Gene e Plant Biotechnology: http://birch.cit.cornell.edu/ar96/ar96.biotech.html e Plant Disease : http://www.scisoc.org/journals/ e Plant Physiology : http://www.plantphysiol.org/ e The Plant cell: http:/Awww.plantcell.org/ e Plant Hormones : Therapy : http://www.stockton-press.co.uk/gt/index.html http://www.plant-hormone bbsre.ac.uk/education/kenhp.htm e Biotech Crop : http://www.usia.gov/topical/global/biotech e EMBL e NCBI ( The National Center for Biotechnology Information ): (Nucleotide Sequence Database) : http://www.ebi.ac.uk/embl/ http://www.ncbi.nlm.nil.gov/ 1.1.2 Địa Website công ty hoạt động lĩnh vực CNSH nước Từ địa Website nắm rõ đặt hàng thiết bị, hóa chất cung cấp Công ty hàng đầu giới CNSH Môt số công ty tiêu biểu sau : e@ CLONTECH: http://www.clontech.com e PROMEGA: e BOEHRINGER e LIFE TECHNOLOGIES : http:/Awww.lifetech.com e BIO-RAD: http:// www.discover.bio-rad.com © QIAGEN : hitp://www.giagen.com http://www.promega.com MANNHEIM : http://biochem.boehringer-mannhein.com 1.1.3 Thong tin Tạp chí liên quan đến lĩnh vực CNSH giới Chúng thu thập địa Website tạp chí CNSH nhằm cung cấp thơng tin lĩnh vực nghiên cứu Thực vật, Nông nghiệp, Bảo vệ trồng, Sinh lý thực vật, Phân bón, Bảo vệ mơi trường, Kích thích tố trồng, Bệnh cây, 2-3 : Tạp Chí Phát triển Khoa học C ‘Ong nghé DHQG-HCM, 2001 For improving the speed of searching, we also build a motif tree If set of clus ter features is {“AAA”, “AAG” “ACA”,"ACC”,”ATA™! we build up a cluster feature tree of order A typical motif tree structure is shown in figure A À4 C GT A CGT A CC G T A C G T Figure 2: A motif tree order In the first step of processing the query, the system will search the pattern in the motif tree for locating the clusters which have highest matching with the pattern A solution Supporting similarity sea As mentioned above, FASTA or BL rch AST techniques are used for search ing the local high Scoring alignment between query pat tern and sequence of DNA database When we receive a query pattern, we will use motif tree for selecting the clusters and finally we use BLAST for matching between patt FASTA or ern and each sequence of selected cluster with a small number of DNA Sequences inst ead of the whole DNA database A Discussion of Time Complexity When we receiv e a4 query pattern, the search ing is proceeded in the tree structure of order The time complexity for searching is O(log,(n)) where n is the cardinal ity of MFMR(S,t) If We use the FASTA or BLASTA met hod which based on the dynamic programming, the time complexity will be is O(mvk) where m is the number of DNA sequences , v is the length of query pattern and k is the length of DNA sequence Therefore, improve the searching our proposed method time can 9, Experiment Re sults € test our proposed method on a set of DNA promoter sequen ce of UCI repository 9.1, Discovering frequent moti fs, maximal frequent motifs, motif phrases With threshold = 0.02, we Some of frequent motifs A.C.T discovered 340 frequent motifs and 256 maximal frequent motifs are listed are as follows: aS AC-AT.AG.CA.CC.CT.CG.TA TC.TT AAG.ACA ACC ACT.ACG.ATA.ATC.AT CAG CCA CCC CCT.CCG.CTA.CTC CT TG.GA.GC.GT.GG.AAA AAC AAT : T.ATG.AGA.AGC.AGT AGG.CAA,CAC CAT T.CTG.CGA.CGC.CGT.CGG.TAA TAC Some maximal frequent TAT motifs are listed as follow s: ACTT.ACT G.ACGA.ACGC Some of the motif phrases are as follows: AAAA*AAAT: AAAA*ACTA: 9.2 Motif reduction ÀAAA*ACTT: AAAA*CACT: AAAA*CTTT Tạp Chí Phát triển Khoa học Công nghệ ĐHQG-HCM, 2001 We discover association rules with CF (a->b) >= 1.0 and CF (b—>a)>= 1.0, ae P(b) or beP(a) Some rules are as follows: “A”—›”AT”, “A”— “CA”, “C—› “CA”, ST”—”?AT", Therefore, we can delete “A” ”C", ”T"” from FR(S,0.02) 9.3 Motif graph and motif clusters We build a motif graph with a = 0.61, a portion of graph matrix is shown in table 2: # Nodel 13 |AAAG 14 | AACA 15 | AACG 16 | ACCG 17 |ATTT Table 2: A portion of motif graph with a = 0.61 Node2 CF(Node1->Node2) GAAA CEF(Node2->Node1) 0.87 ACAT CGCT CGGA 0.68 | 0.65 0.64 0.69 TTTT 0.79 0.62 | 0.73 | 0.75 We discover the connected component s in this graph follows: a Cluster feature : AAAC; CAAA b Cluster feature 2: AAAT; TAAA; TCTT; TTTC; d Cluster feature 4:AATG; ATGC; c Cluster feature 3: AAAG; GAAA: GGTT 0.66 | Some cluster features TTTT; are listed as TTTG; GTTT GCG f Cluster feature 6:ACTG: ATGA: TATG; C: CCTC: CTTG: TTGC, TTGT; TAAT: CTGT; TTAT; TGTG; GTGA 9.4 Similarity query in motif tree When we want to search DNA sequences containi ng patterns AAAC we will focus on cluster ] because this pattern is the subset of its clus ter feature DNA sequences of cluster are shown in table Table 3: DNA sequences of Cluster Seq# DNA Sequence Promoter — PCPA CEL GTATCGAAGTOTGTIGCGGAGTAGATGTTAGAATACTAACAAAC TC 18 21 AACA AA CACTIGATACTOTATGAGCATACAGTATAATTGCTICAAC AGAACA — GA ACCAT Ea AGACAAAAACTCTGAGTGTAATAATGTAGCCTCGTG TCTT GC — GACACCATCGAATGGCGCAAAACCTTTCGCGGTATGGCATGATAGCGC CCGGAAGAG TOCG CRS GACITGTAAACCAAATIGAAAAGATITAGGTITACA AGTCTACACC BOTT OTe oO GTGACAAGGECGCGCAAACCCTCTATACTOCOCGCCGAAGCTG~ SECC AR AA AACGTGITTITIGTIGITAATTCGGTGTAGACTIGTAAAC CTAAAT QỌCCAAAAAATATCTTGTACTATTTACAAAACCTATGGTAACTCTTTAGGCA ~SATCAAAAAAATATICTCAACATAAAAAACTTITGTOTAATACTIGTAACG TTCCT CTACAT 26 33 44 49 31 10 Conclusion and future works We have develop a system supporting the query in a larg e DNA sequence database Firstly We develop algorithm for discovering the frequent motifs, maxi mal frequent motifs motif p Tases Secondly, we reduce set of frequent motifs, maximal frequent motifs motif phrases En we grou p similar DNA sequences based on maximal frequent motif and motif phrases A motif tree order is created for improving the speed of searching We also present the e ‘Periment resu lts on a DNA promoter sequence data set of UCI and analyse the time roMPlexity oF our Proposed algorithm We also use the same method for Protein Database in which the alphabet | has 20 amino acids instead of nucleo tides of DNA sequences We continue to develop Tạp Chí Phát triển Khoa học Cơng nghệ DHQG-HCM, 2001 incremental algorithms for discover ing frequent motifs, maximal freq uent motifs and motif based clusters in upgraded DNA or protein database : References the Technical Committee on Dat a Engineeri ng, Vol 21, No 1, March, (19 98) [3] R Durbinans Anders Krogh: Biological sequence analysis: prob abil isti c models of proteins and nucleotide acids, Cambridge University Press, (1998) [4] Eui-Hong Ha, George Harypi s: Hyper-graph based Clustering in high-dimensional data Sets: a summary of results, Bul letin of the technical Committee on data engineering, March 1998, Vol.21, No.1, IEE E computer society, (1998) Hoang Kiem, Do Phục: Dev elo pin g the motif based algorithm for knowledge in a set of DN discovering the A Sequences:, in Procee dings of the internationa SCT'2000, Florida, l conference USA, (2000) [ Oang Kiem, Do Phuc: A met.hod for discovering binary and fuzzy association mules from 0000) In Proceedings of the intern L7] ational conference AFSS2000, Tsukuba, Japan, Oren Eli Zamir: Clustering Web Documents: A phrase based method Searching engine result: for grouping Ph D thesis, University of W ashington, USA (1999) ] Roderic Guigo: Computational gene identification: an open proble [9 Vol 21, No.4, Elsevier m: Computer Chem Science, Great Britain, (19 97) ÌR.¿ €rawal , R, Srikant, Fast - Algorithm for Mining Associati on Rules in large database, report RJ, IBM Almaden Res earch Center, San Jose, CA (1994), amkumar G.D and Arun Swa (10 Re nmi: Clustering Data Without Distance Functions: Bulletin of the Technical Committee on Data Society, (1998), Engineering, March 1998, Vol 21, No.1, IEEE computer hát triển thuật tốn gom nhóm dựa đoạn lặp hỗ trợ truy vấn thông tỉn CSDL chứa trình tự sinh học ADN Hồng Kiếm, Đỗ Phúc - Khoa Công nghệ Thông tin Dai hoc Khoa hoc Ty nhién, TP Hé Chi Mi nh húng ta ° phát triển thuật t oán hỗ trợ tru y vấn thông tin CSDL chứa trình tự Các đọa ng tỔI gom nhóm trì DNA t + cho clust lặp hay nh ac s aan ` nh tự DNA tương tư thành cluster dựa óm đoạn lặp Miỗi cluster biểu diễn vector đặc trưng biến tố; “T có thành phần đoạn lặp phổ biến tối đại hay nhóm đoạn lặp phổ bước Day Chứng tơi tạo chứa đoạn lặp Tiến trình ° tì a ^ a tìm kiếm tương tự gổm hai thu ật So k lên, hệ thống cla clusterdiyet ° : ae x S€ tìm cluster so khớp tốt, nhấ ^Z ^ , + ~ t với mau truy vấn Sau đó, kỹ a” A` thống đầ no FASTA hay BLAST sẽ.3 ' dùng để2 so khớp4 các` trình tự 0n Hội nghị Khoa học Mội số Vấn để chọn lọc CNTT Hải Phong 7-9/6, 2001 KHAM PHA CAC MAU LAP TRONG TAP CAC TRINH TU DNA HAY PROTEIN BANG CAY HAU TO VA THUAT TOAN DI TRUYEN Đỗ Phúc, Hoàng Kiếm Đại học Khoa học Tự Nhiên TP.HCM Khoa Công nghệ Thông tin 227 Nguyễn Văn Cừ , Quận 5,TP.HCM "x~ Email: phucdo@citd.edu.vn Tom tat Chúng tơi phát triển thuật tốn tìm mẫu lặp phổ biến tập trình tự sinh học tính trạng mẫu lặp phân lớp nhóm trình tự sinh học Thuật giải hậu tố thuật giải tăng cường cho phép cập nhật tập mẫu lặp phổ biến bổ sung thêm trình tự sinh học vào CSDL Thuật giải di truyền sử dụng để tìm mẫu lặp gần giống Một số thử nghiệm tập đữ liệu Promoter Đại học Irvine, California, Mỹ gen kháng sâu BT tiến hành Giới thiệu Bài tốn tìm mẫu lặp tập trình tự DNA hay Protein toán quan trọng phân tích trình tự sinh học Dựa mẫu lặp, ta tìm đặc trưng cho nhóm gen cling tinh trang hay xây dựng luật phân lớp nhóm gen Bài tốn tìm mẫu lặp tập trình tự DNA hay Protein tóm tắt sau: Cho tập trinh tu sinh hoc DNA hay Protein, tim mâu lặp phổ biến có chiều dài h cho trước tâp trình tự sinh học Mức độ phơ biến phản ánh số lượng trình tự sinh học có chứa mẫu lặp Các mẫu lặp giống hệt hay gần Với sở đữ liệu chứa hàng chục ngàn trình tự sinh học chiều dài trình tự vượt 1000 ký tự độ phức tạp Của thuật tốn dạng hàm mũ Với phát triển vượt bậc cơng nghệ sinh học, số lượng trình tự sinh học gia tăng ngày, Web Site sinh học Internet đễ đàng tiếp cận nguồn liệu gen Do cần phát triển thuật tốn có hiệu suất cao để tìm mẫu lặp CSDL gene chứa số lượng lớn trình tự sinh học Trong báo này, tiếp cận thuật giải cấu trúc liệu hậu tố để xây dựng thuật giải tăng cường nhằm phát mẫu lặp giống hệt thuật giải di truyền để tìm mẫu lặp phổ biến gần giống Bài báo tổ chứa sau: 1) Giới thiệu 2) Các định nghĩa hình thức 3) Cây hậu tố tốn tìm mẫu giống hệt 4) Thuật giải truyền tốn tìm mẫu gần giống 5) Thử nghiệm 6) Kết luận hướng phát triển Các định nghĩa hình thức Trong phần định nghĩa số khái niệm làm sơ phát triển thuật giải Định nghĩa 1: Trình tự sinh học Gọi Aa A, tập chữ cấu tạo nên trình tu sinh hoe DNA hay Protein, Với tập trình tự DNA As¿={A,C,G,TỊ phần tử A¿ base cấu tao nên trình tự DNA Với tạp trình tự Protein’ = yy A,=tA,G,D,E,F,G,H,LK.L.MLN,P,Q.R,S,T,V,W,Y}, phần tử A, a acid amin Trình tự sinh học DNA chuỗi chữ lấy từ tập Aa Trình tư sinh học Protein chuỗi chuỗi chữ lấy từ tập A Ta ký hiệu Fạ tập tất trình Hội nghị Khoa học Một số Vấn để chọn lọc CNTT, Hải Phòng 7-9/6 2001 tu DNA duoc tao tir A, va Fp tập trình tự Protein tạo từ A Để tiện trình bày, khảo sát tập trình tự DNA, kết qủa sử dụng tươn g tự cho trình tự Protein Lúc ta gọI F thay vi F, Định nghĩa 2: Mẫu lặp giống hệt[1][2][5 ][6] Cho tập F tập trình tự DNA, goi P(F) 1A tap chuỗi F Với chuỗi aeP(F), ta gọi F.(a) tập trình tự F có chứa chuỗi a Ta gọi a mẫu lặp giống hệt theo nguõỡng te{0,1] với F IF,(a)l /IEl > r Ví dụ: cho tập trinh tu sinh hoc s,,5,, , Ss s,='AC GTTATAAAGTCACACGTAGC CCCACGTACAGT Ssạ= CGCGTCGAAGTCGACC GTGGGAAA GTCACACAGT' Sạ= 'GGTCGATGCACGTTCTAAATCAG TCGCACACAGT' Sạ= ACGTTAGAAAGTAGCT ACCCGT ACGTCACACAGT' S5= ACGTGTTAAAGTCAACGACGTACG TC GTCACAGT' Các mẫu lặp giống hệt với độ phổ biến 1.0 là: AAA, ACG Định nghĩa 3: Mẫu lặp gần giống Goi Ag = Ayu (*} 1a tap chit c4i mo rong cla Ay va Ay= A,U {*} IA tap chữ Ký tự * gọi Cal mo rong cha Áp ký tự bao quát Một chuỗi mở rộng F sé 1A dãy chữ lay tr Age Vi du ACA**AC IA mẫu lặp g6an Đing Các trình tự có chứa ACA, xem có chứa mẫu lặp gần kếgiốnđó hai ký tự đến chuỗi AC g ACA*#**AC | Trong ví dụ trên, mẫu gần giống CGT ***AAA phố biến 1.0 mẫu lặp gần giống với độ Cây hậu tố tốn tìm mẫu lập giống hệt Cây hậu tố cấu trúc mục cho khố có kích thuớc thay đổi [3] (ƯỚC chuỗ Cho i Ss, cay hau tố tạo từ tập chuỗi hậu tố s Với Šo= ACTT, ta có chuỗi hậu tố 'ACTT? ,°CTT’ , ‘TT’ › 1”,Ví dụ: Với hai trình tự sinh học So=’ACTT” va s,=’ACACTT?’ ta có hậu tố sau: ®) ACely mm:) ACTT GO /\ TT O ACTT yr Ân TT C) NGỘ | IRA T XS ` Hình 1; Cây hậu tố mở rợng với mẫu lap DE Hội nghị Khoa học Một số Vấn dê chọn lọc CN'TL, Hải Phòng, 7-9/6 2001 Chúng xây dựng phần mềm GENESYS2000 có chức tạo hậu tố Một hậu tố tiêu biểu trình bày hình Hình 2: Cây hậu tố Mỗi nút nút A, [2]l(0 1) có tên nút A, trình tự chứa mẫu đường từ gốc xuống nút số [ ] la số lượng đó, số ( ) số hiệu trình tự chứa đường từ gốc đến nút Chúng tơi xây dựng thủ tục duyệt InOrder để tìm chuỗi có số lượng vượt q ngưỡng cho trước [2] Ví dụ chuỗi A, AC, ACT, C, CT, CTT chuỗi có mặt hai trình tự sạ S¡ ( ngưỡng 2) : Nhờ hậu tố, tìm mẫu lặp tối đại ( không chuỗi chuỗi lặp nào), Trong ví dụ ACT CTT mẫu lặp tối đại Thuật giải hậu tố có khả tăng cường, thêm trình tự hâu tố cấu trúc lại theo trình tự chuỗi hậu tố Nhờ vào khả này, bổ sung trình tự sinh học, tự động cập nhật tập mẫu phổ biến mà không cần phải làm lại từ đầu Sau đó, duyệt hậu tố để lấy đoạn có mặt tất hay số lượng ( nguõng phố biến) trình tự Các thuật giải thêm, tìm tiến hành với độ phức tạp tính tốn dạng hàm logarít nên hiệu suất tìm kiếm Thuật giải di truyền tốn tìm mẫu Thuật giải di truyền kỹ thuật tìm kiể gần giống m thích nghỉ J Holland để xướng Thuật giải truyền lặp lại uo cơng đoạn tìm kiếm lời giải tập cá thể (lời Hội nghị Khoa học Một số Vấn để chọn lọc CNTT Hải Phòng 7-9/6 2001 giải tiềm năng) tạo nên quần thể toán Tro ng tién trinh lap, c4c c4 thé cha quần thể hành thẩm định mức độ tốt hàm đánh giá mức độ phù hợp dựa kết thâm định để tạo cá thể cho quần thể Thuật giải truyền có cấu trúc sau: Procedure ThuâtGiảiDi truyền Begin t=0 | Khởi tao 16p P(t) Đánh giá lớp P() WVhile not ( điều kiện kết thúc ) Do Begin t=t+1 Chọn loc P(t) tir P(t+1) Kết hợp các thể P(t) Đánh giá lớp P(t) End End Có ba bước thuật giải di truyền a) Tạo quần thể ban đầu tập cá thể tạo ngẫu nhiên b) định nghĩa phép toán lai ghép, phép toán đột biến c) Định nghĩa hàm đo mức độ phù hợp các thể 4.1 Bài tốn tìm mẫu lặp gần giống tâp trình tự sinh học Cho F tập trình tự sinh học có tính trạng, tìm mẫu lặp gần giống a co lchiểu đài h trình tự F [4] Chúng ta dựa vào số trình tự chứa a để tính độ tốt mẫu tiềm a) Nhiém sac thể chuỗi có chiều đài h gọi lời giải tiềm toán Mỗi chữ chuỗi duoc lay tap Ags Vi du: V6i h=8, mot nhiém sac thể có dang ACA*A*CC b) Phép toán lai ghép Với hai nhiễm sác thể a¡a, a, - âu Và bọb, by Dạ, ta chọn ngẫu nhiên vị trí k e[1,h] hoán chuyển phận hai nhiém sac thể cho Kết ta có hai con: Ai4; Đụ, by Va bob) ay c) Phép toán đột biến Với nhiễm sác thể aa, ay, -âv aụ, ta chọn ngẫu nhiên vị trị độ biến k e|1,h ] chọn chữ ngẫu nhiên Ay cho ky tr a, d) Ham pha hop Cho c nhiểm sác thể N(C) số trình tự F có chứa c Hàm phù hợp cho nhiềm sác thể c tính N(c)/| học F FI, với Fl số lượng trình tự sinh 4.2 Bài tốn tìm mẫu lặp gần giống đặc trưng cho hai lớp trình tự sinh học Cho F, tập trình tự sinh họ c thu ộc lớp l F tập trình tự thuộc lớp cho F, AF = Ø, gọi a mẫu lặp gần giống a mẫu phân lớp tốt Vi mo i trinh tu s + thuộc F, s, chứa a có trình tự s thuộc F_ chứa a Hội nghị Khoa học Một số Vấn để chọn lọc CNTI Hải Phòng, 7-9/6 2001 a) Nhiễm sắc thể: chi có chiều dài h gọi lời giải tiềm toán Mỗi chữ chuỗi đựơc lấy tap Ay: b) Phép toán lai ghép Với hai nhiễm sác thé aja) .a a, Va bạb, bụ bạ, ta chọn nsẫu nhiên vị trí k ell, h] hốn chuyển phận hai nhiểm sắc thể cho Kết ta có hai con: a¿a; bụ by Va Doby ay ay c) Phép toán đột biến Với nhiễm séc thé aja) a, a, ta chọn ngau nhién vi tri dé bién k é[1,h] và`chọn chữ ngẫu nhiên Age din ký tự ay Cho c nhiểm sác thể N(c) số trình tự F có chứa c Chúng tơi tính tập họp : TP ={ s e F,l c chuỗi mở rộng s } TN ={ s eF.l c chuỗi mở rộng s } FP ={ s eF lc chuỗi mở rộng s } FN =({ s eF,l c chuỗi mở rộng s } Hàm phù hợp tính dựa cơng thức: x ITPIITNI - IFPIIFNI (ITPI + IFPI) (IFPI + ITNI) { ITNI+1FNI) { IFNI +1 TPI) Hình giao diện phần mềm cài đặt theo thuật giải di truyền cho tốn tìm mẫu lặp gần giống để phân lớp gen Thebe | = y THE HE CO.DIEM TOT NHAT LY 100 EOE GIAI UNG VOI NST TOT, NHẬT CHữ HÁT PHAN LOR POS! TIVE Chươi STATTETEAAL4^BSAT TASCDE ACABATECASTCTER TGBATBBAC Chusi ECTCAATGGCCTCTASACSGGT CTT GAGGGEGTT ULTTBETGABR EC Chuoi motif co chieu dai ‡ duae phạt hiến la: Š TAT Viteitrong chuoi Viti chai la Vitti chuai 1a 52 sere Ket thue 799 4| Hội nghị Khoa học Một số Vấn để chọn lọc CNTT Hải Phịng, 7-9/6 2001 Thử nghiệm Chúng tơi tiến hành thử nghiệm tập liệu Promoter Đại học Irvine, California, My va hai gen BT khang sau lay tir WebSite NCBI Trong thử nghiệm dùng xác xuất lai ghép 0.1 xác suất đột biến 0.1 Số lượng nhiễm sắc thể cho quần thể 50 5.1 Thử nghiệm với tập 106 trình tự Promoter đại học Irvine gồm 53 trình tự thuộc lớp Promoter+ 53 trình tự thuộc lớp Promotvr+ Một số trình tự tiêu biểu thuộc lớp Promoter + lớp Promoter- liệt kê sau đây: OOF ~LT ON] Un slope Trình tự Promoter TACTAGCAATACGCTTGCGTTCGGTGGTTAAGT.XTGTATA:VXTGCGCGGGC TTGTCGT TGCTATCCTGACAGTTGTCACGCTGATTGGTGTCGTTACAATCTAACGCATCGCCAA GTACTAGAGAACTAGTGCATTAGCTTATTTTTTIGTTATCATGCTAACCACCCGGCG AATTGTGATGTGTATCGAAGTGTGTTGCGGAGTAGATGTIAGAATACTAACAAACTC ATATGAACGTTGAGACTGCCGCTGAGTTATCAGCTGTGAACGACATTCTGGCGTCTA CGAACGAGTCAATCAGACCGCTITGACTCIGGTATTACTGTGAACATTATI'CGTCTC CAATGGCCTCTAAACGGGTCTTGAGGGGT [TITTGCTGAAAGGAGGAACI'ATATGCG TIGACCTACTACGCCAGCATTTTGGCGGTGTAAGCTAACCATTCCGGTTGACTCAAT Chúng thu kết sau: Lớp tit d+ [+ [+ #ẽ “ : Với tập 53 trình tự pomoter + ta có mẫu lặp giống hệt: G, AT, CA, TA Với tập 53 trình tự pomoter - ta có mầu lặp giống hệt: AC, AT, AG, CA, CT, TC, TG 5.2 Thử nghiệm với hai gen kháng sâu CrylA(b) va CrylA(c), gen có chiều dài 2000 bases, chúng tơi tìm đoạn lặp gần giống sau chuỗi CrylA(b) khơng có Cry] A(c) sau: Chiều dài mẫu lặp GTGATA Mẫu lặp AGCGATT AACCATGT TACGTTCAA 10 C¥*GGACTT 10 ~ _| GG*GCTTCC Két luan Chúng phát triển thuật tốn tìm mẫu lặp phổ biến trons tập trình tự sinh học tính trạng tập mẫu lặp có mặt nhóm trình tự khơng có mặt nhóm trinh tự khác Thuật giải hậu tố thuật giải tăng cường cho phép cập nhật tập mẫu lặp phố biến bố Chúng sử dụng cấu trúc liệu đa nhánh mở rộng để nút có chứa trỏ đến danh sách trình tự đến nút Chúng tơi sử dụng thuật giải truyền để tìm sung thêm trình tự tạo hậu tố có chứa mẫu từ gdc mẫu lặp gần giống Các thử nghiệm thuật giải nêu với liệu Promoter đại học lrvine California, Mi gồm 106 promoter liệu loài sen kháng sâu BT tiến hành mẫu lặp khám phá trình bày báo Chúng tiến hành xây dựng phần mềm GENESYS2000 với đầy đủ chức hỗ trợ phân tích xử lý DNA va Protein Hội nghị Khoa học Một số Vấn để chọn lọc CNTI Hải Phòng 7-9/6 2001 DISCOVERING THE COMMON SEQUENCE MOTIFS IN DNA OR PROTEIN USING THE SUFFIX TREE AND GENETIC ALGORITHM Do Phuc, Hoang Kiem University of Natural Sciences, HCMC Department of Information Technology 227 Nguyen Van Cu St , Dist, 5, HCM city, Vietnam | Email: phucdo@citd.edu.vn Abstract We have developed the algorithms for discovering the common motifs in a set of biological sequences The suffix tree based algorithms are incremental algorithms which allow to update the set of common motifs when appending new biological sequence The Genetic Algorithm is used for discovering the approximation motifs Some experiments on the Promoter data of the University of Irvine, California, USA and BT genes from NCBI website are carried out Tai liéu tham khao [1] Anders Krogh: An introduction to Hidden Markov Models for biological sequences, Computer Methods in Molecular Biolgy, Elservier, 1998 [2] Hoang Kiem, Do knowledge from DNA Phuc: Developing the algirothms for discovering sequences, In SCI’2000, Florida, USA, 2000 the [3] Paul Bieganski, John Riedl, John Carlis Generalized Siffix Trees for biological Sequence Data: Application and Implementation, The Regents of the University of Minnesota, 1994 [4] Roderic Guigo: Computational gene identification: an open problem, computer chem, Vol 21, No 4, Elsevier Science, Great Britain, 1997 [5] Timothy L Bailey, Charles Elkan Unsupervised Learning on Multiple Motifs in BioPolymers using Expectation Maximization, Machine Learning Journal, Kluwer Academic Publisher, 1995 [6]Timothy L Bailey; Discovering motifs in DNA or Protein: the approximation common substring, Ph D dissertation, University of California, USA, 1995 Tạo thuốc chuyển gen kháng sâu kháng thuốc trừ cỏ thông qua vi khuan Agrobacterium tumefaciens va khao sat tinh di truyền hệ T1 Lê Đức , Nguyễn hữu Hổ , , Trần thị Dung?, Nguyễn văn Un! ( trích từ sách Sinh Thái nơng nghiép bén vitng, NXB Nông nghiệp, năm 2001) Viện Sinh học Nhiệt đới, Trung tâm Khoa học Tự nhiên Công nghệ Quốc gia Trường Đại học Nông Lâm thành phố Hồ Chí Minh U MỞ ĐẦU Trong qúa trình phát triển đất nước, Việt nam vấn để tạo giống trồng có tính trạng cơng nghệ sinh học với phát triển công phá Do công nghệ gen cho phép đưa với 80 % dân số làm nồng nghiệp ưu việt yêu cầu quan trọng Ngành nghệ gen tạo bước đột gen hữu dụng vào trồng để tạo trồng có tính trạng mà mong muốn Thuốc trừ cổ Basta có chứa hoạt chất Phosphinothricin (PPT) tiếp xúc với trồng gây ức chế qúa trình tổng hợp glutamin gây tích lũy ammonia dẫn đến su chết nhanh chóng cay Gen bar phân lập từ vi khuan Str eptomyces hygroscopicus mã hóa cho enzym phosphinothricin acetyl transferase (PAT) Enzym biến đổi PPT từ dạng có tính diệt cổ sang dạng bị acetyl hóa khơng có tính điệt có Gen bar đựơc xem gen kháng thuốc trừ cổ BASTA Cây trồng mang gen khang sau Bt ( Bacillus thuriingiensis ) la ứng dụng công nghệ sinh học việc cải tiến trồng Cây mang gen gây độc tố có khả kháng với sâu hai chinh thuéc ho Lepidoptera, Coleoptera va Diptera Cho đến người ta biết 50 gen ð¡ có khả diệt trùng, loại có phổ gây độc riêng Hàng năm giới phải 8,11 ti USD việc phòng trừ sâu hại trồng Từ năm 1980 công nghệ chuyển gen hình thành, nhà khoa học tập trung chuyển nạp gen Ö¿ vào thực vật để trồng sản sinh protein độc tố để tự bảo vệ Hiện ngồi việc cải tiến kỹ thuật chuyển gen Bt ma phải cải tiến gen thích hdp cho gen Bt, gen vi khuẩn biểu có hiệu qủa thực vật Hàng loạt phương pháp chuyển gen sử dụng để tạo giống chuyển gen Một phương pháp chuyển gen thành công trồng ghi nhận cách sử dụng vectơ Ti plasmid vi khuẩn Agrobacterium Do đó, để góp phần tạo giống trồng có đặc tính mong muốn thông qua công nghệ gen Chúng dùng vi khuẩn Agrobacterium tumefaciens EHA 105 chita plasmid ITB ( Institute of Tropical Biology ) tao thuốc chuyển gen mang đặc tính kháng sâu ( Ø gen ) kháng thuốc trừ cỏ BASTA ( bar gen) Nếu có gen cry!A nhiễm sắc thể sau chạy điện di phản ứng PCR có đoạn ADN khuyếch đại : 0,6 Kb Il KET QUA VÀ THẢO LUẬN Ảnh hưởng PPT đến mô khả tái sinh chéi : Trên mơi trường có PPT nồng độ 50 mg/1, mãnh đối chứng bị màu sau ngày màu hoàn toàn sau 10 ngày Trong số mãnh xử lý chuyển gen cịn màu xanh bắt đầu hình thành cụm mô sẹo chổi nhỏ Những chổi chuyển vào mơi trường rể có 50 mg/1 PPT, chi thuốc qua xử lý chuyển gen Agrobacterium tumefaciens EHA 105 chtta plasmid ITB phát triển rể Trong với thí nghiệm đối chứng, chổi từ mô không xử lý chuyển gen cấy vào môi trường rể chứa 50 mg/I PPT vàng chết tuần lễ Do chúng tơi cho chổi phát triển môi truéng SOmg/ PPT giả định chuyển gen Bang : Tỷ lệ tái sinh chổi chuyển gen mảnh mơi trường có mg/1 PPT sau nhiễm với Agrobacteriưm mẫu đối chứng Mẫu Số mẫu thử | Số lượng mẫu | Số lượng nghiệm tái sinh chổi | thu nhận xử lý | 80 chuyén gen Đối chứng 30 19 68 0 | Tần số chuyển gen ( %) 11,25 0` Sự biểu gen gus chuyển gen Qua thí nghiệm chuyển gen có khoảng 70% sinh trưởng tốt mơi trường có 50 mg/1 PPT xem có biểu gen gs, có màu xanh đặt trưng ảnh ) màu xanh gen gus rat phản ứng bị ảnh hưởng pH nên thuận lợi cho việc kiểm tra.Trong thuốc đối chứng hịan tồn khơng có màu xanh đặt trưng, Sự diện gen bar khả kháng thuốc trv cé Basta Kết qủa phân tích phản ứng PCR ( xem hình ) cho thấy mẫu nhiễn sắc thể chuyển gen xuất băng với kích thước khoảng 500 basc kết qủa việc khuyếch đại gen bar( sử dụng cặp mổi chuyên biệt gen bar ) Do đó, chúng tơi khẳng định gen ðar chuyển vào nhiễn sắc thể Sau trồng vườn ươm 30 ngày, thuốc đối chứng kiểm tra khả chống chịu với thuốc trừ cỏ Basta cách phun thuốc với nồng độ g/l PPT, sau ngày tất thuốc đối chứng đầu bị chết hai nổng độ Do chọn nồng độ g/1 PPT để xử lý số thuốc chuyển gen, sau 10 ngày 42/50 thuốc tiếp tục sinh trưởng phát triển bình thường hoa kết ( hạt coi hệ T1 , số chết biểu gen bzr không mạnh nên kha kháng thuốc trừ cỏ nổng độ cao Sự truyền phân ly gen bar hệ T1 Hạt thuốc T1 kiểm tra di truyền phân ly gen bar phịng thí nghiệm cách xử lý khử trùng nảy mầm môi trường MS Sau 10 ngày chuyển sang môi trường MS có chứa 50 mg/l PPT Két qta sau wan 144/198 tiếp tục phát triển ( tỉ lệ 72,7 % ), 54 phan ly tính trạng khơng cịn gen bar nhiểm sắc thể nên bị vàng chết Riêng đối chứng chết 100%, Đồng thời , hạt TI gieo trồng vườn ươm để kiểm tra khả kháng thuốc trừ cỏ Basta giai đoạn 30 ngày sau trồng , ngày sau phun 48 /60 tiếp tục sinh trưởng phát triển Bảng :Thể tính truyền gen ưaz thuốc hệ TI Giống K326 Số xử lý Số sống TỈ lệ sống K326 C116 C176 Chuyển gen đối chứng chuyển gen đối chứng 30 30 30 30 26 (%) | 86,7 0 22 73,2 0 Qua hai thử nghiệm phòng vườn ươm minh chứng di truyền gen bar hệ T1 củacây thuốc chuyển gen Sự diện gen cryIA(e) khả kháng sâu chuyển gen Sử dụng cặp mồi chuyên biệt cho gen cry/A( c) phản ứng PCR cho thấy mẫu AND chuyển gen xuất băng kích thước 0,6 Kb kết qủa khuyếch đại gen cry/A ( c) khẳng định diện gen cry/A ( c) nhiểm sắc thể chuyển gen Những mang gen crvlA (c ) thử nghiệm tính kháng sâu hai dạng mãnh đặt đĩa petri cho trực tiếp sâu xanh Heliothis armigera lên Sau 3-4 ngày đốii chứng sâu ăn nhiều, điện tích bị hại lớn, trọng lượng sâu tăng lên rõ rệt , trung bình 110g/sâu sau thử nghiệm, chuyển gen bị tổn thương diện tích bị sâu ăn nhỏ , trọng lượng sâu tăng trung bình 20g/sâu sâu chết sau 5-6 ngày , cho thấy chuyển gen đồng thời nhận gen cryIA (c) va gen biểu đủ mạnh để ức chế hoạt động sâu xanh Høliothis armigera Và tiếp tục thử nghiệm khả kháng sâu hệ TI cho thấy đa số tiếp tục đuy trì khả kháng sâu IV KẾT LUẬN Việc sử dụng vị khuẩn Agrobacterium tumefaciens EHA 105 mang plasmid ITB dé chuyén øen, nhận thuốc chuyển gen K 326 C176 mang gen bar (kháng thuốc trừ cỏ Basta ) va gen cryIA (c) ( kháng sâu ) cụ thể sâu xanh Heliothis armigera | Bằng kỹ thuật sinh học phân tử kiểm tra sinh học xác định gen hữu dụng điện thuốc xử lý chuyển gen Cac gen hitu dụng di truyền hệ sau giúp chứng tơi có khả tạo giống thuốc với tíng trạng hữu ích kháng sâu để phục vụ sẵn xuất nông nghiệp Tài liệu tham khảo tệ 10 Đài Chí Bửu, Nguyễn Thị Lang 2000 Di truyền phân tử - Những nguyên tắc chọn giống trồng, II Nhà xuất Nông nghiệp Tp HCM 223 tr, Cheng X, Sardana R, Kapl an H, Altosaar 1998 Agrobacterium-transformed rice plant s expressing synthetic Cry/Ab and Cr+Ì Ác genes are highly toxic to striped stem borer and yellow stem borer Proc Natl Acad Sci 95(6): 2767-2772 Chilton M, Currier T.C Agrobacteriu m tumefaciens DNA and PS8 bacterio phage DNA not detected in crown gall tumor Proc Natl Acad Sci USA 71:3672-3676 (1974 ) Dellaporta S.L.Plant Mol.Biol.Rep.Vol um No : 19-21 (1983) De Greef W, Delon R De Block M, Leemans J Botterman J 1989 Evaluation of herbicide resistance in transgenic crops under field conditions Bio/T echn olog y 7: 61-64 Jefferson R, Kava nagh T.A Gus fusion glucuronidas e as a selective and versatile gene fusion in higher plants EMBO : 3901 -3907 (1987) Krattiger AF 1997 Insect resistan ce in crops: a case study of Bacillus thuringiensis (Bt) and its transfer to developi ng countries ISAAA Bricfs, No.2 Kubo T 1997 Tobacco genetic reso urces and biotechnology, Trong Kazu o Watanabe va Eija Pehu (eds) Plant biotechn ology and plant genetic resources for sustainability and producti vity R G Landes company, Lé Dinh Thuy, Pham Kién Nghiệp 1996 Thuốc trỗng chế biến Nhà xuất bán Tp HCM 314 tr Lee MK, Aguda RM, Cohen MB, Goul d FL, Dean DH 1997 Determination of binding of thuringiensis 65-endotoxin receptor s to rice stem borer midguts Applied and Enviromental Microbiology 63 (4): 1453-1459 Nguyễn Văn Uyển 1995, Những phươ ng pháp công nghệ sinh học thực vật, tập Nxb Nông Nghiệp TpHCM 128 tr, Bacillus 11 12 13 Murashige and Skoog 1962 A revi sed medium for rapid growth and bioassays with tobacco tissue cultures Physiol Plant 15: 473-497 Mark D Burow.1990, High- freq uency Generation of Transgenic tobacco plants after modified leaf disk cocu ltivation Biology Reporter Volume 8(2) 1990, with Agrobacterium tumefaciens Plant Molecular im Mn pment on, 15 16 Roush TR, Shelton MA th l4 1991 Assessing the odds: the emergence of resistance to Bt transgenic plants Nature biotechnology 15: 816-817 Sardana R, Dukiandjiev S, Giband M, Cheng X, Cowan K Sauder C, Altosaar I 1996 Construction and rapid testing of synthetic and modified toxin gene sequences CrylA (6&c) by expression in maize endosperm culture Plant Cell Reports 15: 677-681 Strizhov N, Keller M, Mathur J, Koncr-Kálmán Z, Bosch D, Prudovsley E, Schell J, Sneh B Koncz C, Ziberstein A 1996 A synthetic CryIC gene encoding a Bacillus thuringiensis §-endotoxin, confers Spodoptera resistance in alfalfa and tobacco Proc 17, 18 Natl Acad Sci 93: 15012-15017 Wilkie $.1997 Genomic DNA isolaion, Southern blotting and hybridization Trong Melody S Clark (ed.) Plant molecular biology — A laboratory manual Springer 3298 tr Vaeck M, Reynaerts A, Hufte H, Jansens S, De Marc B, Dean C Marc MV Leemans J 1987 Transgenic plants protected from insect attack Nature 328: 33-37 SUMMARY PRODUCTION OF TRANSGENIC TOBACCO (Nicotiana tabacum L.) PLANTS RESISTANT TO HERBICIDE BASTA AND INSECTS VIA AGROBACTERIUM TUMEFACIENS Hundreds of transgenic tobacco plants containing bar (herbicide resistance gene), cryIA(c) (insect resistance gene) and gusA (marker gene) genes were obtained via Agrobacterium tumefaciens EHA 105 carried plasmid ITB2 (Institute of Tropical Biology) After cocultivation, leaf disks were cultured on selection medium containing 5O0 mg/l PPT (Phosphinothricin) PCR analyses and indigogenic GUS assay were performed to confirm the existence and the expression of bar, cryIA(c) and gusA senes The PPT-resistant transgenic plants were heathy within 12 days after spraying with commercial herbicide BASTA (active ingredient PPT, 49/1) Insect bioassays with Heliothis armigera larvae were conducted, the results showed that the mortality of larvae was 100% The inheritance and Segregation of bar gene in the F1 progeny were observed The results showed the segregation ratio 3:] in Mendel fashion

Ngày đăng: 06/10/2023, 12:30

Tài liệu cùng người dùng

Tài liệu liên quan