Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 87 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
87
Dung lượng
2,36 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN o0o Nguyễn Hải Bằng PHÂNTÍCHHỆPHIÊNMÃVÀSÀNGLỌCMỘTSỐGENGIẢĐỊNHLIÊNQUANTỚITÍNHTRẠNGTĂNG TRƢỞNG ỞTÔMSÚ(PENAEUSMONODON) LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội – 2017 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA SINH HỌC Nguyễn Hải Bằng PHÂNTÍCHHỆPHIÊNMÃVÀSÀNGLỌCMỘTSỐGENGIẢĐỊNHLIÊNQUANTỚITÍNHTRẠNGTĂNG TRƢỞNG ỞTÔMSÚ(PENAEUSMONODON) Chuyên ngành : Di truyền học Mãsố : 60420121 LUẬN VĂN THẠC SĨ KHOA HỌC NGƢỜI HƢỚNG DẪN KHOA HỌC PGS TS ĐINH DUY KHÁNG PGS TS NGUYỄN THỊ HỒNG VÂN Hà Nội – 2017 LỜI CẢM ƠN Lời đầu tiên, xin bày tỏ lòng biết ơn sâu sắc chân thành tới PGS TS Đinh Duy Kháng, Viện Công nghệ sinh học, người truyền thụ cho niềm đam mê khoa học trực tiếp dìu dắt, hướng dẫn trình nghiên cứu hoàn thành luận văn tốt nghiệp Tôi xin trân trọng cảm ơn PGS TS Nguyễn Thị Hồng Vân, chủ nhiệm môn Di Truyền học-Trường Đại học Khoa học tự nhiên Hà Nội, người thầy tạo dựng ý tưởng khoa học hết lòng giúp đỡ trình học tập nghiên cứu Trong thời gian học tập nghiên cứu vừa qua, nhận giúp đỡ, động viên tạo điều kiện thuận lợi PGS TS Đồng Văn Quyền, Phó Viện Trưởng Viện Công nghệ sinh học; TS Nguyễn Cường, Trưởng phòng Tin sinh học Viện Công nghệ sinh học anh chị em Phòng Vi sinh phân tử, phòng Tin sinh học Viện Công nghệ sinh học Nhân dịp xin chân thành cảm ơn giúp đỡ quý báu Tôi xin bày tỏ lòng biết ơn tới thầy, cô giáo anh chị em đồng nghiệp thuộc Bộ môn Y Sinh học Di truyền, Trường Đại học Y Dược Hải Phòng, nhiệt tình hỗ trợ, tạo điều kiện cho trình học tập nghiên cứu Luận văn thực khuôn khổ Nhiệm vụ “Lập đồ gentômsú(Penaeus monodon)”thuộc nhiệm vụ quỹ gen cấp Nhà Nước với tài trợ kinh phí Bộ Khoa học Công nghệ giai đoạn 2012-2016 PGS TS Đinh Duy Kháng làm chủ nhiệm Cuối cùng, xin gửi lời cảm ơn đến gia đình, bạn bè, học trò, người chia sẻ, động viên tạo điều kiện để học tập, nghiên cứu hoàn thành luận văn Hà Nội, ngày tháng năm 2017 Học viên Nguyễn Hải Bằng MỤC LỤC MỞ ĐẦU CHƢƠNG TỔNG QUAN 1.1 Giới thiệu tômsú 1.2 Tình hình nghiên cứu hệgenhệphiênmãtômsú giới 1.2.1 Công trình nghiên cứu liênquantớihệphiênmãtôm 1.2.2 Xác địnhgenliênquantớihệ miễn dịch tôm thông qua việc phântíchhệphiênmã 1.2.3 Xác địnhgen có liênquantới khả sinh sản tôm 1.2.4 Xác địnhgen có liênquantới giới tínhtômsú 1.2.5 Nghiên cứu giải trình tự hệgenhệphiênmãtômsú Thái Lan 1.2.6 Nghiên cứu lập đồ gentômsú Đài Loan 1.2.7 Nghiên cứu giải mãhệgenhệphiênmãtômsú Việt Nam 1.3 Công nghệ đọc trình tự hệ 11 1.3.1 Hệphiênmã 11 1.3.2 Công nghệ đọc trình tự hệ Illumina 11 1.3.3 Đọc trình tự hệphiênmã RNA-seq 13 1.4 Các phƣơng pháp phântíchhệphiênmãsử dụng công cụ tin sinh 13 1.4.1 Tiền xử lý liệu 13 1.4.2 Lắp ráp de novo hệphiênmã 16 1.4.3 Chú giải hệphiênmã công cụ BLASTX 19 1.5 Tínhtrạngtăng trƣởng sốgen ứng viên liênquantớitínhtrạngtăng trƣởng động vật giáp xác 20 1.5.1 Tínhtrạngtăngtrưởng 20 1.5.2 Các nhóm genliênquan đến tínhtrạngtăngtrưởng công bố nhóm giáp xác 21 1.5.3 Các nhóm gen ứng viên trình lột xác 27 1.5.4 Các genphân giải phát triển hệ trình lột xác 30 CHƢƠNG 2: VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 33 2.1 Vật liệu 33 2.1.1 Dữ liệu giải trình tự 33 2.1.2 Hệ máy chủ tính toán hiệu cao 34 2.2 Sơ đồ quy trình nghiên cứu 35 2.3 Phƣơng pháp tiền xử lý liệu 36 2.4 Phƣơng pháp lắp ráp de novo hệphiênmã 36 2.5 Phƣơng pháp đánh giá chất lƣợng lắp ráp hệphiênmã 37 2.6 Phƣơng pháp giải unigene hệphiênmã 38 2.7 Phƣơng pháp phântích biểu hệphiênmã 39 CHƢƠNG 3: KẾT QUẢ VÀ THẢO LUẬN 40 3.1 Kết đánh giá tiền xử lý liệu trình tự đọc thô 40 3.2 Kết lắp ráp hệphiênmã từ mô mô gan tụy tômsú Penaeus monodon 44 3.3 Chú giải chức hệphiênmã từ mô mô gan tụy tômsú Penaeus monodon 46 3.4 Phân loại Gene Ontology 52 3.5 Phân loại đƣờng trao đổi chất KEEG 53 3.6 Sànglọc unigene thuộc nhóm gen/gen giảđịnhliênquan đến tínhtrạngtăng trƣởng từ hệphiênmã từ mô mô gan tụy tômsú Penaeus monodon 54 3.7 Phântích biểu hệphiênmã từ mô mô gan tụy tômsú Penaeus monodon 58 KẾT LUẬN 65 KIẾN NGHỊ 66 TÀI LIỆU THAM KHẢO 67 DANH MỤC CÁC CHỮ VIẾT TẮT 3’UTR cDNA : Complement deoxyribonucleic acid Contig : Contiguous nucleotide sequence DNA : deoxy ribonucleic acid EC : Enzyme commission IHHNV : 3’ untranslated region (trình tự không dịch mã đầu 3’) : infectious hypodermal and hematopoietic necrosis virus (virus gây gệnh hoại tử quan tạo máu quan tạo biểu mô) MBV : monodon baculovirus (virus gây bệnh còi) Nr-NCBI : non redundant protein database-National Center for Biotechnology Information PCR : Polymerase Chain Reaction (phản ứng khuếch đại gen) RNA : ribonucleic acid RNA-seq : RNA sequencing TSV : Taura syndrome virus (virus gây hội chứng Taura) WSSV : White spot syndrome virus (virus gây hội chứng đốm trắng) YHV : Yellow head virus (virus gây bệnh đầu vàng) DANH MỤC BẢNG Bảng 2.1 Thông tin máy chủ tính toán hiệu cao 34 Bảng 3.1 Thống kê số lượng, độ dài trình tự đọc theo mô 43 Bảng 3.2.Thống kê kết lắp ráp hệphiênmãtinh từ mô mô gan tụy tômsú Penaeus monodon 45 Bảng 3.3.Thống kê kết giải hệphiênmãtômsúsở liệu 51 Bảng 3.4 Liệt kê 51 unigene liênquan đến tínhtrạngtăngtrưởng 56 Bảng 3.5 Điểm số biểu FPKM 51 unigene liênquantớitínhtrạngtăngtrưởng 60 DANH MỤC HÌNH Hình 1.1 Tômsú thu từ vùng biển Nghệ An, Việt Nam Hình 1.2 Minh họa cách hoạt động cửa sổ trượt 16 Hình 1.3 Quá trình lắp ráp hệphiênmã de novo Trinity 18 Hình 2.1 Định dạng FASTQ 34 Hình 2.2 Cách tính N50 38 Hình 3.1 Kết đánh giá chất lượng liệu trình tự đọc thô liệu trình tự đọc tinh mô 40 Hình 3.2 Kết đánh giá chất lượng liệu trình tự đọc thô liệu trình tự đọc tinh môgan tụy 42 Hình 3.3 Phân bố độ dài toàn unigene hệphiênmãtinh 46 Hình 3.4 Phân bố độ dài toàn unigene có kết BLASTX (A) phân bố độ dài toàn unigene kết BLASTX (B) 47 Hình 3.5 Thống kê kết giải sở liệu Nr-NCBI 50 Hình 3.6 Sơ đồ Venn thể kết giải sở liệu 52 Hình 3.7 Thống kê thông tin giải chức ngân hàng Gene Ontology 53 Hình 3.8 Thống kê 10 đường chuyển hóa có số lượng unigene tham gia nhiều 54 Hình 3.9 Số lượng unigene biểu đặc trưng mô mô gan tụy tập 17.406 unigene 58 Hình 3.10 Biểu đồ nhiệt (heatmap) minh họa điểm biểu 16.184 unigene DEG mô mô gan tụy 59 MỞ ĐẦU Tômsú(Penaeusmonodon) loài thủy sản mang lại giá trị kinh tế lớn, nhiều nước trọng phát triển nhưThái Lan, Việt Nam, Hàn Quốc, Đài Loan, Malaysia, Indonesia, Ấn Độ…[63] Nghề nuôi tômsú có ưu lớn với nước nguồn tài nguyên địa nuôi khai thác lâu dài, đóng góp quan trọng vào vấn đề an toàn lương thực, xóa đói giảm nghèo phát triển kinh tế xã hội nước Chiến lược phát triển lâu dài toàn khu vực có ngành sản xuất tômsú bền vững, hạn chế tối thiểu tác động tiêu cực đến môi trường sinh thái Nền tảng cho chiến lược phát triển phát triển nguồn tôm địa với chương trình nhân giống khoa học để nâng cao tỷ lệ sống tăngtrưởng Để đạt mục đích này, việc nghiên cứu cấu trúc chức toàn hệgentômsú vấn đề khoa học có định hướng ứng dụng quan trọng Nghiên cứu hệgentômsú cung cấp thông tin xác cho việc xác địnhtínhtrạngquan trọng như: tínhtrạngtăng trưởng, tính kháng bệnh, tính chống chịu với điều kiện môi trường, tínhtrạngliênquan đến chất lượng tôm Do kích thước hệgentômsú lớn, khoảng 2,17 Gb [76] nên việc giải mã toàn hệgentômsú đòi hỏi thời gian tốn nhiều kinh phí Vì vậy, để bước khai thác thông tin cần thiết từ hệgentômsú phục vụ thực tiễn sản xuất việc giải mãphầnhệgen giải mãhệphiên mã, giải mãphân đoạn hệgen có định hướng sử dụng kỹ thuật GBS (Genome typing by Sequencing) với phương pháp xác định trình tự genhệ NGS (Next generation sequencing) cách tiếp cận thông minh khả thi Hệphiênmã tập hợp tất phân tử RNA thể sinh vật có khả mã hóa protein [18], cầu nối từ thông tin trình tự hệgen đến chức hệ protein Chính phântíchhệphiênmã giúp thu kết sâu phântích chức protein tương ứng Sự đời công nghệ giải trình tự (NGS) tạo điều kiện thuận lợi để thu nhận khai thác thông tin hệgenhệphiênmã sinh vật [71] RNA-seq công nghệ giải trình tự hệ với đối tượng RNA RNA-seq giúp nhà nghiên cứu tìm hiểu sâu thông tin liênquan trình tự hệphiênmãphântích chức gen Bằng phương pháp tính toán số lượng trình tự thu từ RNA-seq, người ta đánh giá mức độ biểu gen Đây phương pháp có khả thay phương pháp micro-array truyền thống [71] Hiện giới, nghiên cứu hệphiênmã chia làm hướng: i) đối tượng có liệu tham chiếu cần sử dụng phương pháp re-sequencing; ii) với dự án thực loài chưa có liệu tham chiếu cần tiếp cận theo phương pháp lắp ráp de novo [28],[47],[59],60] Do chưa có hệphiênmã tham chiếu, nên loài tômsú Penaeus monodon, từ liệu giải trình tự hệhệphiênmã từ mô mô gan tụy tômsú thu nhận từ vùng biển Bắc Trung Bộ Việt Nam, tiến hành đề tài: “Phân tíchhệphiênmãsànglọcsốgengiảđịnhliênquantớitínhtrạngtăngtrưởngtômsú Penaeus monodon” Mục tiêu nghiên cứu đề tài: - Xây dựng đồ hệphiênmã từ mô mô gan tụy tômsú Penaeus monodon thu nhận từ vùng biển Bắc Trung Bộ Việt Nam - Sànglọcgengiảđịnhliênquan đến tínhtrạngtăngtrưởngtômsú - Phântích biểu hệphiênmã từ mô mô gan tụy tômsú Penaeus monodon Đề tài thực Phòng Vi sinh vật học phân tử Phòng Tin sinh học, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học Công nghệ Việt Nam KẾT LUẬN VÀ KIẾN NGHỊ KẾT LUẬN Trong nghiên cứu này, đánh giá, tiền xử lý, lắp ráp de novo hệphiênmã từ mô mô gan tụy tômsú Penaeus monodonthu nhận từ vùng biển Bắc Trung Bộ Việt Nam Số lượng phiênmã (transcript) hệphiênmã thô 157.995 số lượng unigene hệphiênmãtinh 17.046 Hệphiênmãtinh có kích thước trung bình 403,06 bp; số N50 402 bp.Toàn unigene hệphiênmãtinh giải với sở liệu khác (Nr-NCBI, Swiss-Prot, KEGG, GO) với kết giải 1957 unigene, cung cấp thông tin tổng quan chức hệphiênmã thu từ mô cơ, mô gan tụy tômsú Đã sànglọc 51 unigene thuộc 18 nhóm gen/gen giảđịnhliênquantớitínhtrạngtăngtrưởngtômsú Trong đó: Có nhóm gengiảđịnhliênquantớitínhtrạngtăngtrưởng đặc trưng cho mô cơ, nhóm gen: Actin, Profilin, Myosin heavy chain, Calponin/calponintransgelin, Tropomyosin, Troponin, Muscle LIM protein LIM binding domain Có nhóm gengiảđịnhliênquan đến tínhtrạngtăngtrưởng đặc trưng cho mô gan tụy, Alpha-amylase, Fatty acid binding protein liver, Cathepsin L Phântích biểu cho thấy: Trong tổng số 17.406 unigene hệphiênmãtinh sạch, có 13.448 unigene biểu đặc trưng cho mô cơ, 574 unigene biểu đặc trưng cho mô gan tụy Đã xác định 16.184 unigene tập 17.406 unigene có biểu khác biệt mô 14.599 unigene biểu tăng mô so với mô gan tụy 1585 unigene biểu tăng mô gan tụy so với mô Trong số 51 unigene tiềm thuộc 18 nhóm gen/gen giảđịnhliênquantớitínhtrạngtăngtrưởngtômsú có 38 unigene biểu khác biệt mô mô gan tụy, có 11 unigene biểu tăng mô gan tụy so với mô 27 unigene biểu tăng mô so với mô gan tụy 65 KIẾN NGHỊ Xác địnhgiá trị biểu 51 unigene thuộc 18 nhóm gen/gen giảđịnhliênquantớitínhtrạngtăngtrưởngtômsútính theo điểm số FPKM Real time PCR Tiếp tục nghiên cứu sànglọc thị phân tử micosatellite, SNP unigene hệphiênmãtinh có 51 unigene thuộc 18 nhóm gen/gen giảđịnhliênquantớitínhtrạngtăngtrưởngtômsú 66 TÀI LIỆU THAM KHẢO Tiếng Việt Thái Trần Bái (2013),Động vật học không xương sống, Nhà xuất giáo dục Việt Nam Nguyễn Văn Cách (2005), Tin sinh học, Đại học Bách khoa Hà Nội Nguyễn Văn Chung, Phạm Thị Dự (1995), Danh mục tôm biển Việt Nam, Nhà xuất Văn Hóa Nông Văn Hải,Kim Thị Phương Oanh (2012), Nghiên cứu giải trình tự phầngen xây dựng sở liệu genome tômsú (P monodon), Đề tài thuộc Chương trình công nghệ sinh họcthủy sản Bộ Nông nghiệp&PTNT 2008-2010 Nguyễn Thị Minh Thanh, Nguyễn Hải Triều, Phạm Thị Hoa, Nguyễn Thị Hoa, Hà Thị Thu, Đậu Huy Tùng, Vũ Thị Hiền, Nguyễn Hữu Ninh, Nguyễn Thị Tuyết Nhung, Đồng Văn Quyền, Đinh Duy Kháng (2015), “Đánh giátính đa hình quần đàn tômsú(Penaeusmonodon) thu nhận từ vùng biển Việt Nam kỹ thuật AFLP”, Tạp chí Công nghệ Sinh học, 13(1), tr 31-38 Nguyễn Giang Thu, Phạm Thị Hoa, Nguyễn Hải Triều, Nguyễn Thị Hoa, Hà Thị Thu, Đậu Huy Tùng, Vũ Thị Hiền, Nguyễn Thị Tuyết Nhung, Đồng Văn Quyền, Đinh Duy Kháng (2015), “Sử dụng kỹ thuật Nested-PCR đánh giá mức độ nhiễm WSSV MBV mẫu tômsú thu nhận từ sốtỉnh thành miền Bắc Việt Nam”, Tạp chí Công nghệ Sinh học, 13(2A), tr 423428 Nguyễn Giang Thu, Nguyễn Hải Triều, Phạm Thị Hoa, Nguyễn Thị Hoa, Hà Thị Thu, Đậu Huy Tùng, Vũ Thị Hiền, Nguyễn Thị Tuyết Nhung, Nguyễn Văn Lâm, Phạm Quang Huy, Nguyễn Cường, Nguyễn Hữu Ninh, Nguyễn Lê Anh, Trần Quốc Quân, Cao Tiến Dũng, Đồng Văn Quyền, Chu Hoàng Hà, 67 Đinh Duy Kháng (2015), “Giải trình tự lắp ráp de novo hệphiênmãtômsú(Penaeus monodon)”, Tạp chí Công nghệ Sinh học, 13(2A), tr 417-422 Nguyễn Văn Thường, Trương Quốc Phú (2009), Giáo trình ngư loại II (Giáp xác nhuyễn thể), Trường Đại học Cần Thơ Nguyễn Văn Tư (2006), Giáo trình Sinh lý Cá Giáp xác, Trường Đại học Nông Lâm Thành phố Hồ Chí Minh Tiếng Anh 10 Abdel Rahman A M., Kamath S., Lopata A L., Helleur R J (2010), “ Analysis of the allergenic proteins in black prawn (Penaeusmonodon) and characterization of the major allergen tropomyosin using mass spectrometry”, Rapid Commun Mass Spectrom, 24, pp 2462-2470 11 Andriantahina F., Liu X., Feng T., Xiang J (2013), “Current status of genetics and genomics of reared penaeid shrimp: information relevant to access and benefit sharing”, Mar Biotech, 15(4), pp 399-412 12 Asaro A., del Valle J.C., López Mañanes A.A (2011), “Amylase, maltase and sucrase activities in hepatopancreas of the euryhaline crab Neohelice granulata (Decapoda: Brachyura: Varunidae): partial characterization and response to low environmental salinity”,Sci Mar, 75, pp 517-524 13 Ashburner M., Ball C A., Blake J A., Botstein D., Butler H., Cherry J M., Davis A P., Dolinski K., Dwight S S., Eppig J T., Harris M A., Hill D P., Issel-Tarver L., Kasarskis A., Lewis S., Matese J C., Richardson J E., Ringwald M., Rubin G M., Sherlock G (2000), "Gene ontology: tool for the unification of biology The Gene Ontology Consortium", Nature Genetics, 25(1), pp.25–29 14 Bach I (2002), “The LIM domain: regulation by association”, Mech Dev, 91, pp 5-17 15 Baranski M., Gopikrishna G., Robinson N.A., Katneni V.K., Shekhar M.S., Shanmugakarthik J., Jothivel S., Gopal C., Ravichandran P., Kent M., 68 Arnyasi M., Ponniah A.G (2014), “The Development of a High Density Linkage Map for Black Tiger Shrimp (Penaeusmonodon) Based on cSNPs”, PLoS ONE 9(1): e85413 16 Bolger A M., Lohse M.,Usadel B (2014), "Trimmomatic: a flexible trimmer for Illumina sequence data",Bioinformatics, 30(15), pp 2114-2120 17 Brady P., Elizur A., Cummins S F., Nguyen N.H., Williams R.,Knibb W (2013), "Differential expression microarrays reveal candidate genes potentially associated with reproductive dysfunction of captive-reared prawn Penaeus monodon", Aquaculture, 400–401, pp.14–28 18 Brown T A (2002), Chapter Transcriptomes and Proteomes Genomes2nd, Wiley-Liss, Oxford 19 Campbell N A., Reece J B (2009), Biology 8th, The Benjamin Cummings Publishing Company, San Francisco 20 Chang E.S., Mykles D.L (2011),“Regulation of crustacean molting: A review and our perspectives”,Gen Comp Endocrinol, 172, pp 323–330 21 Clarke K., Yang Y., Marsh R., Xie L., & Zhang K K (2013), "Comparative analysis of de novo transcriptome assembly",Science China Life Sciences, 56(2), pp.156–162 22 Conesa A.,Götz S (2008), "Blast2GO: A Comprehensive Suite for Functional Analysis in Plant Genomics",International Journal of Plant Genomics, 2008, pp.1–12 23 de la Vega E., Degnan B M., Hall M R.,Wilson K J (2007), "Differential expression of immune-related genes and transposable elements in black tiger shrimp (Penaeusmonodon) exposed to a range of environmental stressors", Fish & Shellfish Immunology, 23(5), pp.1072-1080 69 24 Garber M., Grabherr M G., Guttman M., & Trapnell C (2011), "Computational methods for transcriptome annotation and quantification using RNA-seq",Nature Methods, 8(6), pp.469–477 25 Gjedrem T (2005), Selection and breeding programs in aquaculture, Springer, Dordrecht 26 Glenn K L., Grapes L., Suwanasopee T., Harris D L., Li Y., Wilson K., Rothschild M F (2005), “SNP analysis of AMY2 and CTSL genes in Litopenaeus vannamei and Penaeus monodon”, Anim Genet, 36, pp 235-236 27 Gross P S., Bartlett T C., Browdy C L., Chapman R W., Warr G W (2001),“Immune gene discovery by expressed sequence tag analysis of hemocytes and hepatopancreas in the Pacific white shrimp, L vannamei, and the Atlantic white shrimp, L setiferus”, Dev Comp Immunol, 25(7), pp 565577 28 Guo Q., Ma X., Wei S., Qiu D., Wilson I W., Wu P., Tang Q., Liu L., Dong S., Zu W (2014),“De novo transcriptome sequencing and digital gene expression analysis predict biosynthetic pathway of rhynchophylline and isorhynchophylline from Uncaria rhynchophylla, a non-model plant with potent anti-alzheimer’s properties”, BMC genomics, 15(676) 29 Guzvic M (2013), “The history of DNA sequencing”, J Med Biochem, 32, pp 301-312 30 Haas B J., Papanicolaou A., Yassour M., Grabherr M., Blood P D., Bowden J., Couger M B., Eccles D., Li B., Lieber M., MacManes M D., Ott M., Orvis J., Pochet N., Strozzi F., Weeks N., Westerman R., William T., Dewey C N., Henschel R., LeDuc R D., Friedman N.,Regev A (2013), "De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis" Nature Protocols, 8(8), pp.14941512 70 31 Holthuis, L.B (1980), Volume 1-Shrimps and prawns of the world An annotated catalogue of species of interest to fisheries, FAO species catalogue 32 Hu K.J., Leung P.C (2004),“Shrimp cathepsin L encoded by an intronless gene has predominant expression in hepatopancreas, and occurs in the nucleus of oocyte”,Comp Biochem Physiol B Biochem Mol Biol, 137, pp 2133 33 Huang S., Ruiqiang L., Zhonghua Z., Li L., Xingfang G., Wei F., William J L., Xiaowu W., Bingyan X., Peixiang N (2009), “The genome of the cucumber, Cucumis sativus L.”, Nature genetics, 41(12), pp: 1275-1281 34 Idury M R., Michael S W (1995), “A new algorithm for DNA sequence assembly”, Journal of computational biology, 2(2), pp: 291-306 35 Jung H., Lyons R E., Dinh H., Hurwood D A., McWilliam S., Mather B P (2011), “Transcriptomics of a Giant Freshwater Prawn (Macrobrachium rosenbergii): De Novo Assembly, Annotation and Marker Discovery”, PloS ONE, 6(12): e27938 36 Jung H., Lyons R E., Hurwood D A., Mather P B (2013), "Genes and growth performance in crustacean species: a review of relevant genomic studies in crustaceans and other taxa", Reviews in Aquaculture, 4, pp 1-34 37 Kanehisa M.,Goto S (2000), "KEGG: Kyoto Encyclopedia of Genes and Genomes", Nucleic Acids Research, 28(1), pp.27-30 38 Langmead B., Salzberg S L (2012), "Fast gapped-read alignment with Bowtie 2", Nature Methods, 9(4), pp.357-359 39 Laufer H., Borst D., Baker F C., Reuter C C., Tsai L W., Schooley D A., Carrasco C., Sinkus M (1987),“Identification of a juvenile hormone-like compound in a crustacean”, Science, 235, pp 202-205 71 40 Leelatanawit R., Klinbunga S., Puanglarp N., Tassanakajon A., Jarayabhand P., Hirono I., Aoki T., Menasveta P (2004),“Isolation and characterization of differentially expressed genes in ovaries and testes of the giant tiger shrimp (Penaeus monodon)”, Mar Biotechnol, 6, pp 506-510 41 Lehnert S A., Wilson K J., Byrne K.,Moore S S (1999), "Tissue-Specific Expressed Sequence Tags from the Black Tiger Shrimp Penaeus monodon",Marine Biotechnology, 1(5), pp.465-476 42 Lesk A (2008), Introduction to Bioinformatics, Oxford University Press 43 Li B., Dewey C N (2011), "RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome", BMC Bioinformatics, 12(1), pp 3-23 44 Li H., Handsaker B., Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G.,Durbin R.(2009), "The Sequence Alignment/Map format and SAMtools",Bioinformatics, 25(16), pp.2078–2079 45 Li R., Wei F., Geng T., Hongmei Z., Lin H., Jing C., Quanfei H., Qingle C., Bo L., Yinqi B (2010), “The sequence and de novo assembly of the giant panda genome”, Nature, 463(7279), pp: 311-317 46 Liu L., Li Y., Li S., Hu N., He Y., Pong R., Lin D., Lu L., Law M (2012), “ Comparison of next-generation sequencing systems”, J Biomed Biotechnol, 2012, pp 251-364 47 Lv J., Liu P., Gao B., Wang Y., Wang Z., Chen P., Li J (2014), “ Transcriptome Analysis of the Portunus trituberculatus: De Novo Assembly, Growth-Related Gene Identification and Marker Discovery”, PloS ONE, 9(4): e94055 48 Maneeruttanarungroj C., Pongsomboon S., Wuthisuthimethavee S., Klinbunga S., Wilson K J., Swan J., Li Y., Whan V., Chu K H., Li C P., Tong J., Glenn K., Rothschild M., Jerry D., Tassanakajon A (2006), 72 “ Development of polymorphic expressed sequence tag-derived microsatellites for the extension of the genetic linkage map of the black tiger shrimp (Penaeus monodon)”, Anim Genet, 37(4), pp 363-368 49 Medler S., Brown K J., Chang E S., Mykles D L (2005), “Myosin heavy chain gene expression in adult lobster skeletal muscle”, Bio Bull, 208, pp 127-137 50 Medler S., Lilley T., Mykles D L (2004), “Fiber polymorphism in skeletal muscles of the American lobster, Homarus americanus: continuum between slow-twitch (S1) and slow-tonic (S2) fibers”, J Exp Biol, 207, pp 2755-2767 51 Miller R J., Sergey K., Granger S (2010), “Assembly algorithms for nextgeneration sequencing data”, Genomics, 95(6), pp: 315-327 52 Moriya Y., Itoh M., Okuda S., Yoshizawa A C.,Kanehisa M (2007), "KAAS: an automatic genome annotation and pathway reconstruction server",Nucleic Acids Research, 35(suppl 2), pp.182–185 53 MyklesD.L (2011), “ Ecdysteroid metabolism in crustaceans”,J Steroid Biochem Mol Biol, 127, pp 196–203 54 O'Leary N A., Trent H F., Robalino J., Peck M., Mckillen D J., Gross P S (2006),“Analysis of multiple tissue-specific cDNA libraries from the Pacific whiteleg shrimpLitopenaeus vannamei”,Integrative and Comparative Biology, 46, pp 931–939 55 Pabinger S., Andreas D., Maria F., Rene S., Michael S., Mirjana E., Birgit K., Michael R S., Johannes Z., Zlatko T (2014), “A survey of tools for variant analysis of next-generation genome sequencing data”, Briefings in bioinformatics, 15(2), pp 256-278 56 Pevzner A P., Haixu T., Michael S W (2001), « An Eulerian path approach to DNA fragment assembly”, Proceedings of the National Academy of Sciences, 98 (17), pp: 9748-9753 73 57 Postel U., Thompson F., Barker G., Viney Mn Morris S (2010), “Migrationrelated changes in gene expression in leg muscle of the Chrismas Island red crab Gecarcoidea natalis: seasonal preparation for long-distance walking”, J Exp Biol, 213, pp 1740-1750 58 Preechaphol R., Leelatanawit R., Sittikankeaw K., Klinbunga S., Khamnamtong B., Puanglarp N., Menasveta P (2007),“Expressed sequence tag analysis for identification and characterization of sex-related genes in the giant tiger shrimp Penaeus monodon”, Journal of Biochemistry and Molecular Biology, 40(4), pp 501-510 59 Rismani Yazdi H., Haznedaroglu B Z., Hsin C., Peccia J (2012),“Transcriptomic analysis of the oleaginous microalga Neochloris oleoabundans reveals metabolic insights into triacylglyceride accumulation”,Biotechnology for biofuels, 5(74) 60 RismaniYazdi H., Haznedaroglu B Z., Bibby K., Peccia J.(2011),“Transcriptome sequencing and annotation of the microalgae Dunaliella tertiolecta: pathway description and gene discovery for production of next-generation biofuels”,BMC genomics, 12 (148) 61 Robalino J., Almeida J S., McKillen D., Colglazier J., Trent H F., Chen Y A., Peck M E., Browdy C L., Chapman R W., Warr G W., Gross P S (2007),“Insights into the immune transcriptome of the shrimp Litopenaeus vannamei: tissue-specific expression profiles and transcriptomic responses to immune challenge”,Physiol Genomics, 29, pp 44–56 62 Robinson M D., McCarthy D J., Smyth G K (2010), “ edgeR: a Bioconductor package for differential expression analysis of digital gene expression data”, Bioinformatics, 26, pp 139-140 63 Rosenberry B (2004), World shrimp farming 2004 In Shrimp News International, San Diego, California, USA 64 Sookruksawong S., Sun F., Liu Z.,Tassanakajon A (2013), "RNA-Seq analysis reveals genes associated with resistance to Taura syndrome virus 74 (TSV) in the Pacific white shrimp Litopenaeus vannamei",Developmental & Comparative Immunology, 41(4), pp.523–533 65 Supungul P., Klinbunga S., Pichyangkura R., Jitrapakdee S., Hirono I., Aoki T., Tassanakajon A (2002),“Identification of immune-related genes in hemocytes of black tiger shrimp (Penaeus monodon)”,Mar Biotechnol, 4(5), pp 487–494 66 Supungul P.,Klinbunga S., Pichyangkura R., Hirono I., Aoki T., Tassanakajon A., (2004),“Antimicrobial peptides discovered in the black tiger shrimp Penaeus monodon using the EST approach”,Diseasesof aquatic organisms, 61, pp 123-135 67 Tangprasittipap A., Tiensuwan M., Withyachumnarnkul B (2010), “ Characterization of candidate genes involved in growth of black tiger shrimp Penaeus monodon”, Aquaculture, 307, pp 150-156 68 Tassanakajon A., Klinbunga S., Paunglarp N., Rimphanitchayakit V., Udomkit A., Jitrapakdee S., Sritunyalucksana K., Phongdara A., Pongsomboon S., Supungul P., Tang S., Kuphanumart K., Pichyangkura R., Lursinsap C (2006), “ Penaeus monodon gene discovery project: the generation of an EST collection and establishment of a database”,Gene, 384, pp 104-112 69 Thanh N M., Barnes A C., Mather P B., Li Y.,Lyons R E (2010), "Single nucleotide polymorphisms in the actin and crustacean hyperglycemic hormone genes and their correlation with individual growth performance in giant freshwater prawn Macrobrachium rosenbergii",Aquaculture, 301, pp.715 70 Verheyen E M., Cooley L (1994), “Profilin mutations disrupt multiple actin-dependent processes during Drosophila development”, Development, 120, pp 717-728 75 71 Wang Z., Gerstein M.,Snyder M (2009), "RNA-Seq: a revolutionary tool for transcriptomics",Nature Reviews Genetics, 10(1), pp.57-63 72 Wilson K., Cahill V., Ballment E.,Benzie J (2000), "The Complete Sequence of the Mitochondrial Genome of the Crustacean Penaeus monodon: Are Malacostracan Crustaceans more closely related to Insects than to Branchiopods?",Molecular Biology and Evolution, 17(6), pp.863874 73 Wilson K., Li Y T., Whan V., Lehnert S A., Byrne K., Moore S S (2002), “ Genetic mapping of the black tiger shrimp Penaeus monodon with amplified fragment length polymorphims”, Aquaculture, 204, pp 297-309 74 Yamano K., Unuma T (2006), “Expressed sequence tags from eyestalk of kuruma prawn, Marsupenaeus japonicus”, Comp Biochem Physiol,143A, pp 155-161 75 Ye J., Fang L., Zheng H., Zhang Y., Chen J., Zhang Z., Wang J., Li S., Li R., Bolund L.,Wang J (2006), "WEGO: a web tool for plotting GO annotations", Nucleic Acids Research, 34(suppl 2), pp.293–297 76 You E M., Liu K F., Huang S W., Chen M., Groumellec M L., Fann S J., Yu H.T (2010), "Construction of integrated genetic linkage maps of the tiger shrimp (Penaeusmonodon) using microsatellite and AFLP markers", Animal Genetics, 41(4), pp.365–376 77 Zhao Q.Y., Wang Y., Kong Y.-M., Luo D., Li X.,Hao P (2011), "Optimizing de novo transcriptome assembly from short-read RNA-Seq data: a comparative study", BMC Bioinformatics, 12(Suppl 14), pp.S2 76 PHỤ LỤC KẾT QUẢ CHÚ GIẢI 51 UNIGENE THUỘC 18 NHÓM GEN/GEN GIẢĐỊNHLIÊNQUANTỚITÍNHTRẠNGTĂNG TRƢỞNG ỞTÔMSÚ PENAEUS MONODON Các nhóm gen Tên unigene Chiều dài c44070_g1_i1 Pancreatic alpha- 1746 amylase alpha-amylase 776 Cyclophilin c50035_g1_i1 c61443_g1_i1 c61287_g1_i1 c62382_g1_i2 c19823_g1_i1 alpha-amylase alpha-amylase cathepsin L cathepsin L cyclophilin A Fatty acid-binding protein c41270_g1_i1 fatty acid- 678 binding liver intracellular fatty 2225 acid binding fatty acid binding 945 Alpha-amylase Cathepsin L c83210_g1_i1 Chú giải c41041_g1_i1 c61108_g1_i1 Fibrillarin c43879_g1_i1 Glyceradehyde-3-phosphate dehydrogenase (GAPDH) c62621_g1_i1 Profilin c41374_g1_i1 Growth hormone and c62969_g1_i1 insulin-like growth factor c19902_g1_i1 c54868_g1_i1 Secreted Protein Acidic and c60039_g1_i1 1946 2302 1829 1195 821 rRNA -O- 612 methyltransferase fibrillarin glyceraldehyde1546 3-phosphate dehydrogenase profilin 848 TBC1 domain family member insulin-like growth factorbinding complex acid labile subunit isoform X1 insulin-degrading enzyme isoform SPARC 319 1487 Evalue Trung bình Độ tƣơng đồng Trung bình 84,95% 3,57E120 0 0 2,09E104 1,39E81 2,08E64 1,28E58 2,66E48 79,32% 95,93% 66,58% 77,68% 84,39% 82% 91,05% 62% 79,19% 75,27% 89,06% 6,3E- 67,53% 83 8,27E- 74% 07 6,35E- 46,17% 51 784 3,58E- 68,8% 77 1352 6,53E- 77,95% Rich in Cysteine (SPARC) Methyl farnesoate and c60754_g1_i1 farnesoic acid Omethyltransferase c61318_g1_i2 Ecdysteroid c50607_g1_i1 Calponin/calponintransgelin c13961_g1_i1 farnesoic acid Omethyltransferase farnesoic acid Omethyltransferase ecdysoneinducible E75 isoform X4 Calponin-3 calponin homology domaincontaining DDB_G0272472 isoform X1 c165984_g1_i1 tropomyosin c51091_g1_i1 Tropomyosin c54212_g1_i2 Muscle LIM protein c62133_g1_i1 c62133_g2_i1 c62133_g3_i1 c43449_g1_i1 c56823_g1_i1 Troponin c41556_g1_i1 c37833_g1_i2 c53843_g1_i1 c53843_g2_i1 LIM domain binding c56793_g1_i2 1141 1028 3035 1024 1136 2166 tropomyosin535 isoforms 9A A B isoform X9 muscle lim 2799 muscle LIM Mlp84B isoform X2 Muscle LIM Mlp84B muscle LIM Mlp84B isoform X1 PDZ and LIM domain isoform X1 troponin skeletal muscle isoform X3 troponin I 1546 1739 276 90 94,94% 2,47E- 55% 53 84,28% 1,24E- 75,5% 105 8,58E- 60,17% 10 1,07E- 98,36% 157 2,46E- 86,83% 19 3,45E- 67% 07 8,47E- 65,26% 142 9,09E- 77,4% 35 1,23E- 66,25% 17 1318 3,45E- 60,65% 26 1530 3,04E- 77,37% 70 1204 4,21E90 1,87E54 2,82E67 1,82E31 troponin C 745 isoform 2b troponin isoform 916 1-like LIM domain- 626 binding 89,16% 85,77% 86,23% 71,35% LIM domain and actin-binding domainc61458_g1_i2 LIM binding c62336_g3_i2 actin c106986_g1_i1 actin 949 7E-10 61,15% 2249 80,95% c166206_g1_i1 actin 87c 453 2,76E101 9,67E55 1,31E74 1,72E44 c60234_g1_i2 Actin 1305 327 actin-binding 1207 Rho-activating like isoform X1 c151792_g1_i1 actin-interacting 553 280 c175914_g1_i1 actin-related c53399_g1_i1 Myosin heavy chain myosin heavy chain type heavy c62492_g3_i1 myosin chain type heavy c66492_g1_i1 myosin chain type heavy c167495_g1_i1 myosin chain myosin heavy c372_g1_i1 chain type c20008_g1_i1 muscle myosin heavy chain heavy c22261_g1_i1 myosin chain type heavy c32014_g1_i1 myosin chain heavy c43972_g1_i1 myosin chain isoform B c62492_g1_i1 97,32% 95,5% 91,95% 67,78% 4006 4,39E- 81,55% 80 1,31E- 82,2% 22 85,15% 1752 87,2% 206 4,61E16 3,38E61 2,33E56 1,27E75 2,05E73 1,62E116 1,47E55 84,35% 295 322 525 512 670 425 92,65% 88,89% 94,81% 76,6% 90,67% 89,8% ... HỌC Nguyễn Hải Bằng PHÂN TÍCH HỆ PHIÊN MÃ VÀ SÀNG LỌC MỘT SỐ GEN GIẢ ĐỊNH LIÊN QUAN TỚI TÍNH TRẠNG TĂNG TRƢỞNG Ở TÔM SÚ (PENAEUS MONODON) Chuyên ngành : Di truyền học Mã số : 60420121 LUẬN VĂN... mã tôm 1.2.2 Xác định gen liên quan tới hệ miễn dịch tôm thông qua việc phân tích hệ phiên mã 1.2.3 Xác định gen có liên quan tới khả sinh sản tôm 1.2.4 Xác định gen có liên quan. .. Phân tích hệ phiên mã sàng lọc số gen giả định liên quan tới tính trạng tăng trưởng tôm sú Penaeus monodon” Mục tiêu nghiên cứu đề tài: - Xây dựng đồ hệ phiên mã từ mô mô gan tụy tôm sú Penaeus