(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam(Luận án tiến sĩ) Sàng lọc và biểu hiện gen mã hóa protein ức chế protease của vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận tại vùng biển Miền Trung, Việt Nam
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - TRẦN THỊ HỒNG SÀNG LỌC VÀ BIỂU HIỆN GEN MÃ HÓA PROTEIN ỨC CHẾ PROTEASE CỦA VI SINH VẬT LIÊN KẾT HẢI MIÊN Spheciospongia vesparium THU NHẬN TẠI VÙNG BIỂN MIỀN TRUNG, VIỆT NAM LUẬN ÁN TIẾN SĨ CÔNG NGHỆ SINH HỌC HÀ NỘI, 2020 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - TRẦN THỊ HỒNG SÀNG LỌC VÀ BIỂU HIỆN GEN MÃ HÓA PROTEIN ỨC CHẾ PROTEASE CỦA VI SINH VẬT LIÊN KẾT HẢI MIÊN Spheciospongia vesparium QT2 THU NHẬN TẠI VÙNG BIỂN MIỀN TRUNG, VIỆT NAM Chuyên ngành: Công nghệ sinh học Mã số: 9420201 LUẬN ÁN TIẾN SĨ CÔNG NGHỆ SINH HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS.NCVCC Phạm Việt Cường PGS.TS Nguyễn Thị Kim Cúc Hà Nội, 2020 LỜI CÁM ƠN Lời đầu tiên, xin bày tỏ lịng kính trọng biết ơn sâu sắc tới PGS.TS.NCVCC Phạm Việt Cường, nguyên Viện trưởng Viện Nghiên cứu Khoa học Miền Trung, Viện Hàn lâm Khoa học Công nghệ Việt Nam- Nhà Khoa học mẫn cán, người thầy mẫu mực- người giúp định hướng nội dung, giúp đỡ tinh thần, kiến thức chuyên môn, sở vật chất bảo tận tình giúp tơi vượt qua nhiều khó khăn để hoàn thành Luận án suốt năm qua Tôi xin chân thành cảm ơn sâu sắc tới PGS.TS Nguyễn Thị Kim Cúc, Chủ nhiệm đề tài ĐTĐLCN.17/14 “Nghiên cứu metagenome vi sinh vật liên kết hải miên biển miền Trung Việt Nam nhằm phát sàng lọc chất hoạt tính sinh học mới” định hướng cho luận án quan tâm, giúp đỡ suốt thời gian thực luận án Tôi xin cảm ơn Ban lãnh đạo Viện Nghiên cứu Khoa học Miền Trung cử học, tập thể Trung tâm sinh học Phân tử Nghĩa Đơ, Ths.NCS Tơn Thất Hữu Đạt, phịng quản lý tổng hợp Viện Nghiên cứu Khoa học Miền Trung tạo điều kiện cho tơi làm việc, hồn thành thủ tục giấy tờ hoàn thiện nội dung nghiên cứu Tôi trân trọng cảm ơn Học viện Khoa học Công nghệ, Viện Công nghệ Sinh học tạo điều kiện thuận lợi sở vật chất giúp đỡ tơi hồn thành thủ tục cần thiết q trình học tập Cuối cùng, tơi xin gửi lời cảm ơn đến gia đình, bạn bè người thân bên cạnh động viên, giúp đỡ, chia sẻ tạo điều kiện tốt cho tơi học tập, nghiên cứu hồn thiện luận án Hà Nội, ngày tháng năm 2019 Tác giả NCS Trần Thị Hồng i LỜI CAM ĐOAN Tôi xin cam đoan: Đây cơng trình nghiên cứu tơi số kết cộng tác với cộng khác; Các số liệu kết trình bày luận án trung thực, số kết lần cơng bố tạp chí khoa học chun ngành có uy tín với đồng ý cho phép đồng tác giả Phần cịn lại chưa cơng bố cơng trình khác Hà Nội, ngày tháng năm 2019 Tác giả NCS Trần Thị Hồng ii MỤC LỤC Lời cảm ơn i Lời cam đoan .ii MỤC LỤC iii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT vi DANH MỤC CÁC BẢNG viii DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ix MỞ ĐẦU CHƯƠNG I TỔNG QUAN .3 1.1 Hải miên vi sinh vật liên kết hải miên 1.1.1 Giới thiệu hải miên 1.1.2 Vi sinh vật liên kết hải miên 1.2 Sơ lược metagenomics 14 1.3 Chất ức chế protease (PIs) 19 1.3.1 Sơ lược protease 19 1.3.2 Chất ức chế protease phân loại 20 1.3.3 Cơ chế hoạt động PIs 25 1.3.4 Ứng dụng chất ức chế protease 28 1.3.5 Tình hình nghiên cứu PIs từ vi sịnh vật liên kết với hải miên nước 31 1.4 Hệ biểu gen ngoại lai Escherichia coli Pichia pastoris 35 CHƯƠNG II VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 37 2.1 Vật liệu nghiên cứu 37 2.1.1 Vật liệu… 37 2.1.2 Đối tượng nghiên cứu… 39 2.1.3 Hóa chất… 39 2.1.4 Máy móc thiết bị 39 2.1.5 Dung dịch môi trường sử dụng 40 2.2 Phương pháp nghiên cứu 42 2.2.1 Phương pháp tách DNA metagenome VSV liên kết hải miên 43 iii 2.2.2 Định danh hải miên bằng sinh học phân tử 43 2.2.3 Phân tích liệu metagenomics 43 2.2.4 Tổng hợp gen PIs từ CSDL metagenomics hải miên thiết kế plasmid mang gen PIs 47 2.2.5 Các phương pháp sử dụng để thu hồi protein PIs tái tổ hợp hệ biểu E coli (DE3) 48 2.2.6 Các phương pháp sử dụng để thu hồi protein PIs tái tổ hợp hệ biểu nấm men Pichia pastoris 49 2.2.7 Phương pháp xác định hoạt tính ức chế protease 50 2.2.8 Phương pháp xác định ảnh hưởng số yếu tố đến protein PIs tái tổ hợp 52 2.2.9 Phân tích thống kê 52 CHƯƠNG KẾT QUẢ VÀ THẢO LUẬN 53 3.1 Thu thập mẫu hải miên 53 3.2 Kết tách chiết DNA metagenome 54 3.2.1 Tách chiết DNA metagenome vi sinh vật liên kết hải miên biển Quảng Trị 54 3.2.2 Định danh hải miên QT2 bằng sinh học phân tử 55 3.3 Xây dựng sở liệu DNA metagenome vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 biển Quảng Trị, Việt Nam tin sinh học 56 3.3.1 Lắp ráp reads DNA metagenome 56 3.3.2 Kết dự đoán gen 58 3.3.3 Kết giải phân loại chức gen 60 3.3.4 Đa dạng sinh học vi sinh vật liên kết hải miên Spheciospongia vesparium QT2 biển Quảng Trị 64 3.3.5 Khai thác gen có hoạt tính ức chế protease (PIs) dựa sở liệu (CSDL) metagenomics 71 3.4 Nghiên cứu biển ức chế protease (PIs) hệ Escherichia coli 75 3.4.1 Phân tích trình tự a xít amin phân loại protein PI-QT 76 iv 3.4.2 Thiết kế vectơ biểu pET-32a(+) mang gen PIs 78 3.4.3 Biểu gen PIs E coli chủng BL21(DE3) 79 3.4.4 Nghiên cứu điều kiện thích hợp để thu protein tái tổ hợp PI-QT trạng thái tan cao 81 3.4.5 Tinh protein tái tổ hợp PI-QT E coli nhận diện bằng khối phổ 87 3.4.6 Thử hoạt tính ức chế protein tái tổ hợp PI-QT với protease 89 3.5 Nghiên cứu biển ức chế protease (PIs) hệ nấm men Pichia pastoris 91 3.5.1 Tạo plasmid pPIC9 mang gen PI-QT 91 3.5.2 Tạo dòng tế bào Pichia pastoris SMD1168 mang gen PI-QT 92 3.5.3 Biểu gen PI-QT nấm men P pastoris SMD1168 93 3.5.4 Kết thử hoạt tính ức chế protein PI-QT biểu nấm men 96 3.5.5 Kết phát chất ức chế protease bằng điện di gel SDSPAGE có bổ sung chất casein 0,1 % 97 3.5.6 Khảo sát yếu tố ảnh hưởng đến biểu P pastoris SMD 1168 [pPIC9/PI-QT] 98 3.5.7 Tinh protein PI-QT tái tổ hợp biểu nấm men P pastoris qua cột sắc ký lực Trypsin-Sepharore 4B 104 3.5.8 Ảnh hưởng số yếu tố đến protein PI-QT 106 KẾT LUẬN VÀ KIẾN NGHỊ 112 DANH MỤC CƠNG TRÌNH CỦA TÁC GIẢ 113 TÀI LIỆU THAM KHẢO 114 v DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ACN Acetonitrile Amp Ampicillin BLAST bp, kb, kDa CFU Basic Local Alignment Search Tool Base pair, Kilo base, Kilo dalton Colony forming units CSDL Cơ sở liệu CTAB Cetyl trimêtylamôni brômua ĐC Đối chứng DN Đà Nẵng DNA Deoxyribonucleic Acid dNTP Deoxyribonucleotide triphosphate đtg Đồng tác giả DTT Dithiothreitol E coli Escherichia coli EDTA Ethylenediaminetetraacetic acid EtBr FA Ethidium bromide AntiFoam HMA High microbial abundance IAA 3-Indolebutyric acid IPTG Isopropyl β-D-1-thiogalactopyranoside KH&CN LB: LMA Khoa học Công nghệ Luria-Bertani Low microbial abundance mRNA Messenger RNA NCBI National Center for Biotechnology Information P pastoris PCR Pichia pastoris Polymerase Chain Reaction PIs Protein inhibitors QT Quảng Trị vi RNA Ribonucleic acid RNase Ribonuclease SCUBA Self contained underwater breathing apparatus SDS Sodium dodecyl sulphate TAE Tris-Acetic-EDTA Taq polymerase TBS TE Polymerase Thermus aquarius Tris-buffered saline Tris- EDTA TFA Axit trifluoroacetic TQ Trung Quốc VSV Vi sinh vật vii DANH MỤC CÁC BẢNG Bảng 1.2 Chất ức chế protease từ vi sinh vật liên kết hải miên…………… Bảng 2.1 Thành phần gel polyacryamide 42 Bảng 3.1 Chất lượng DNA tổng số tách từ mẫu hải miên biển 32 Quảng trị 54 Bảng 3.2 Kết lắp ráp DNA metagenome mẫu QT2 57 Bảng 3.3 Kết dự đoán, cluster genes kiểm tra tính tồn vẹn gen (mẫu QT2) 59 Bảng 3.4 Tổng hợp kết giải chức gen (QT2) 60 Bảng 3.5 Phân loại reads 16S rRNA hải miên Spheciospongia vesparium QT2 theo giới ngành 65 Bảng 3.6 Phân loại reads 16S rRNA hải miên Spheciospongia vesparium QT2 đến lớp 66 Bảng 3.7 Phân loại reads 16S rRNA hải miên Spheciospongia vesparium QT2 đến họ; chi 68 Bảng 3.8 Kết sàng lọc gen có hoạt tính protease inhibitor từ CSDL metagenomics QT2 71 Bảng 3.9 Gen có hoạt tính sinh học (so với Việt Nam) 73 Bảng 3.10 So sánh hoạt tính ức chế protease protein PI-QT tinh thu hồi biểu P pastoris SMD1168 E coli BL21(DE3) 106 viii 20 Phụ lục Danh sách số OUT phân loại vi sinh vật TT OTU Domain Phylum Class Order Family 324 Bacteria Deferibacteres Deferibacteres Deferibacterales PAUC34f 626 Bacteria Proteobacteria Gammaproteobacteria Oceanospirillales ZD0405 666 Bacteria Proteobacteria Gammaproteobacteria PYR10d3 451 Bacteria Proteobacteria Deltaproteobacteria Sh765B-TzT-29 130 Bacteria Actinobacteria Acidimicrobiia Acidimicrobiales uncultured 233 Bacteria Proteobacteria Deltaproteobacteria GR-WP33-30 901 Bacteria Chloroflexi TK10 362 Bacteria Acidobacteria Acidobacteria BPC015 437 Bacteria Acidobacteria Holophagae TK85 10 31 Archaea Thaumarchaeota Marine-Group I Kết phân tích MiSeq tìm thấy nhiều ngành phân lập chưa phân Deferribacteres, lập như: Thaumarchaeota, Deinococcus-Thermus, Acidobacteria, Planctomycetes, Chloroflexi, Delta-proteobacteria, Epsilon-proteobacteria, Beta-proteobacteria, Spirochaetes, Verrucomicrobia Vì đoạn gen giải NGS thường ngắn (read), vài trăm bp nhóm với mức 97 % 98.5 % (OUT), nên tất nghiên cứu định danh đến mức chi Trong nhiều OTU phân loại đến mức họ độ tương đồng thấp, nên OTU lồi Ngồi nhiều OTU phân loại unculture, nghĩa thuộc nhóm vi sinh vật chưa ni cấy 21 Phụ lục Trình tự gen 18S rRNA mẫu hải miên QT2 GAAGGCAGCA GGCGCGCAAA TTACCCAATC CCGACTCGGG GAGGTAGTGA CAATAAATAA 71 CAATGCCGGG CTTTCTTAGT CTGGCAATTG GAATGAGTAC AATCTAAACC CCTTAACGAG 141 GAACAATTGG AGGGCAAGTC TGGTGCCAGC AGCCGCGGTA ATTCCAGCTC CAATAGCGTA 211 TATTACTGTT GTTGCAGTTA AAAAGCTCGT AGTTGGATTT CGGGGCAGCC TGGCTGGTCC 281 GCCGCAAGGC GAGTACTGGT CAGCCGCCCT TCCTCTCGAA AGCCCCGACT GCTCTTCGTT 351 GCAGTGGTCG GGTAGTCCGG GACGTTTACT TTGAAAAAAT TAGAGTGTTC AAGGCAGGCC 421 TACGCCTGAA TACATTAGCA TGGAATAATG GAAGAGGACC TCGGTCCTAT TTTGTTGGTT 491 TCCAGGGCCG AAGTAATGAT TAAGAGGGAC AGTTGGGGGC ATTCGTATTT AATTGTCAGA 561 GGTGAAATTC TCGGATTTAT GAAAGACGAA CAACTGCGAA AGCATTTGCC AAGGATGTTT 631 TCATTAATCA AGAACGTTAG TTAGGGGTTC GAAGACGATC AGATACCGTC GTAGTCCTAA 701 CCATAAACTA TGCCGACTAG GGATCGGTGG ATGTTAGCGT TTGACTCCAT CGGCACCTTA 771 TGAGAAATCA AAGTCTTTGG GTTCCGGGGG GAGTATGGTC GCAAGGCTGA AACTTAAAGG 841 AATTGACGGA AGGGCACCAC CAGGAGTGGA GCCTGCGGCT TAATTTGACT CAACACGGGG 911 AAACTCACCA GGTCCAGACA TAGTAAGGAT TGACAGATTG AGAGCTCTTT CTTGATTCTA 981 TGGGTGGTGG TGCATGGCCG TTCTTAGTT 22 Phụ lục 10 Blast số trình tự axit amin giải chất ức chế protease từ CSDL metagenomics QT2 contig000433 Prokka_41698 Serpin B8 Met N T G K T S K R P F L W L Met C L V S L L F A G C N N L S A I F S D E G R D E P E T V S I D T N V V T A N T Q F G F D L F N E I R K I E Q D K N I F I S P L S I S I A L A MetT L N G A S G E T E Q A Met A N T L H L Q G L G S E A I N P G Y A G L R Q A L Q V A D P K V I L T I A N S L W A R Q D V P FKQDFLQRNTEYFGAEVSTLNFTDPNTLPTINQWINTNTNGKITKILDEIN P D T V L F L I N A I Y F K G T W Q T E F D P S R T R D G T F Y L A T G A E K Q I P Met Met T R T G D Y P Y Y E N N D A K F Q A I S L P Y G D G R Met S Met Y I F L P Y P E S D I N T F L D G L N T E N W E S W V S Q L R D Q E L F L S Met P K F K L E Y E K T L N N P L Q S L G Met G I A F A P G L A D F S Q Met A D L E A L G Q N L Y I G E V L H K A V V E V N E E G T E A A A V T S V G I R A T S A P P A F Met A N R P F F F A I R D N E T K T V L F Met G T V V D P Stop 23 contig000046 Prokka_10704 Serpin (serine protease inhibitor) Met T K Q L I N A T I I A C V G L I Y L L G C S G E E D V L H E D E L L E Met S L E E G A P T A P D GCAILAKPAGFTDNALSEANAKFGFKLLAELYNQKPNKNVFISPLSISIAL T Met T Y N G A R G A T K Q A Met A K T L E I E G Met D L G A V N Q A N A E L R E I L K S A D P Q IELAIANSIWLRNTFDEVNPDFLDRNDRFFGAEIASLDFDDPQTVETINQ W V N T N T Q G K I K E I L G E I E E H E V Met F L I N A I Y F K G G W K G K F D A S K T Q D G V F H L L D G G E K Q V P Met Met S H T C N Y S Y L E S G D F R A V G L P Y G E G R V S Met Y I F L P E H S S N L D E F L A D L N A E N W E N W L S R F W N E R D L R F I Met P R F R L E Y G Met L L N D A L K A L G Met E I A F I P Y V A N L E G I A P L L F I E K V I H K T F L E V N E E G T E A A A V T L V S P P P A S T P G P F V V N R P F F F A I H D N W T N T I L F Met G I V V E P MetStop 24 contig003635, Prokka_126438 Serpin B9 Met I K R Q H P E P T G R G R N A G R G R R F S I P A A L L L L S P A G C G L L E P D V E E I Met R L P R A L T A G E I E V I R A S N R F A F D L L A Q A N E A N E N L F L S P L S A S Met A L G Met S Met N G A D G E T W N Q Met R D V L G F G S L A E E E I N D S Y K S L I E L L V G L D P T V E T A I GNSVWTRSGFPVVPDFLNTVREVFGAEVAELDFASPSASERINEWVNDA T R G R I E D I V P D V I P A G V V Met Y L L N A I Y F K G S W T F Q F D P S K T R T E P F H L D D G S T R T V P L Met T L S K T L P Y R E D G R F Q A V D L P Y G G R A F T Met T V L L P G Q G V S V D T L A A N L D A G E W E D V A D G F R D T D V T L F L P R F R Met S Y E R Met L N D D L A A L G Met V D A F D P Y R A D F T R L S P V A P L A I S E V K Q K S W V D V N E E G T E A A A V T S A G T Y T G G V P V V R A D R P F L F F I R E R L S G T I L F A G K F A S P T A E Stop 25 contig000199 Prokka_21375 Serpin MDNEQSEHRPDSGNRVRGAARRGWLPGAGAVLLLAAAGCGGPSTVPVPGLPPIPGVPPADPPSAPELPR ALSATEVDVIAAGNRFGFDLLREANRPGDNLFLSPFSASMALGMTMNGAGGETWNQMRDALGFGGLT EEEINAGYASLIQVLTELDPAVETAIGNSVWTRLGFPLRAEFVDVLREFFGAEAAELDFAGPSASGRVNE WVRSATGGHIEEIVPDPIPPAVLMFLINAIYFNAPWTFEFDPDDTRTEPFYPEDRSPREVPLMTILRDFLYL ETSRFQAVDLPYGGGAFSMTVLVPREDVRVDDVVASLDAPAWSDVTGGFEETEVELFLPRFRMEYERE LKDDLAALGMVDAFSPGKADLTRLSPVDLSISSVRQKALVEVTEEGTEAAAATVVIGVTSAPPPPVTVR ADRPFLFFIRERLTGAIIFVGKVAHPPPR 26 Prokka_130363 Met K T Q L T L L L A L L A P L P A L S I G Y V Y T G V G D D G R Q H L E L T S V T V D V Q I D E RIARTRTDQIFTNHAEWEVEGIYEFTLPEGAIITDLVLWIGDKRIQG EVLE K E E A R R T Y D D I V G R R I D P A L I E Q V S P N Q F R L S I F P F P A K G S R R V E F E Y Met Q L L E S H S G R L D Y S F P L A P E T D Q P L Q Met E L F V L R A Q V R S Q H A F E A T T S G L P R LTEIDRPDAHRANIFFGDEKIKPREDFTLTIRQTDDRPKPTVLSFAPRAND D L G Y Y A L W L P P L P E L T R D G P L P R S L T F V I D I S S S Met Q E G K L R A V K G A L T A AIDALDAGDLFNIVVFTHRANSFAAAPVPADPDNKKAATAFINQQDALG V S N F E A G L G R A Met Q Q A F P A N R V N H V I F L T D G L P T I G E L E L A S L S E Met V G E WSAGQARLFTIGVGQDVDQGFLSGLAEDHRGEAYFLSEEGDIEAALQEL FESFTFPILLLDELSFDQVEIHDVHPRGLETLAAGRELFQVGRYRGGGTF T L S L A G H Met G E E N Met S L D F P L E F T Q T D V S G S L I P R L W A Y Q K I Q A L E E Q I S RFGEKQELLDDILALGLEYRLVTRRTSLFAPDDGVEVNPQPRDQVALNF GGIDDLFDSSSESDQEEDDEFFSTAVNDARPTTHWLGRDFFLYDEVWIDL A Y Q P G Met P R E L Y E S R T Y Q P A E L A H F A R L G Q A Met L V V V E E R A Y E I P A D A Q GSRPVLLQNAPNPFNASTTISFLIPFRLANEPTRLSIYNLAGQLVRVLQLE A L Q A G E H R L S W D G R D D Y G R E V A S G V Y I Y R L D V G E W A V H R R Met L L L R Stop 27 Phụ lục 11 Trình tự gen, axít amin PI-QT Trình tự gen ATGACAAAAC AGTTGATTAA TGCAACGATC ATCGCATGTG TCGGATTGAT TTATCTGCTT GGGTGTTCAG 71 GTGAAGAAGA TGTGTTGCAT GAGGATGAAC TTCTTGAGAT GTCTCTTGAA GAAGGAGCCC CAACGGCACC 141 TGATGGGTGT GCAATTTTAG CAAAGCCTGC TGGTTTCACC GATAATGCAC TGTCCGAAGC AAATGCAAAG 211 TTCGGCTTTA AACTACTCGC CGAACTGTAT AATCAAAAAC CCAACAAAAA CGTCTTTATC TCCCCATTAA 281 GCATTTCGAT AGCTTTGACC ATGACATATA ATGGTGCCAG AGGCGCAACA AAACAGGCAA TGGCAAAGAC 351 GCTAGAGATC GAGGGAATGG ACCTGGGTGC GGTCAACCAA GCTAACGCCG AGTTACGAGA AATCCTTAAG 421 AGCGCAGATC CCCAGATTGA ACTTGCCATC GCCAACTCGA TCTGGCTACG GAACACGTTT GATGAAGTAA 491 ATCCCGATTT CCTTGACCGA AATGATCGAT TCTTTGGCGC AGAGATTGCT TCGCTTGATT TTGACGATCC 561 GCAAACAGTA GAGACCATCA ACCAATGGGT GAACACGAAC ACACAGGGAA AAATCAAGGA GATTCTAGGT 631 GAAATTGAGG AGCACGAAGT TATGTTCCTG ATTAACGCCA TCTATTTTAA GGGCGGCTGG AAAGGAAAGT 701 TCGACGCATC AAAAACACAG GACGGTGTTT TCCATCTGTT GGATGGTGGC GAGAAGCAGG TGCCCATGAT 771 GTCCCACACC TGCAATTATT CGTATCTTGA GAGCGGAGAC TTTAGGGCTG TTGGCTTACC TTATGGAGAG 841 GGACGTGTAA GCATGTATAT CTTTCTGCCG GAGCATTCCT CCAATCTTGA CGAATTTCTT GCAGATTTGA 911 ACGCCGAGAA CTGGGAGAAC TGGCTGTCGC GGTTTTGGAA TGAACGGGAT TTGAGATTTA TAATGCCTCG 981 CTTTAGACTA GAGTATGGAA TGCTTCTCAA TGACGCGCTC AAAGCACTCG GCATGGAAAT TGCCTTTATT 1051 CCGTACGTAG CCAATCTTGA GGGCATTGCG CCTCTTTTGT TTATTGAAAA AGTCATACAC AAAACTTTTT 1121 TGGAAGTCAA CGAAGAAGGC ACCGAAGCGG CTGCCGTAAC GTTGGTTAGT CCACCACCGG CGAGCACTCC 1191 GGGGCCCTTT GTTGTAAACC GCCCCTTTTT CTTCGCCATC CATGACAATT GGACAAACAC AATATTGTTC 1261 ATGGGAATTG TCGTCGAACC GATGTAG Trình tự axit amin Met T K Q L I N A T I I A C V G L I Y L L G C S G E E D V L H E D E L L E Met S L E EGAPTAPDGCAILAKPAGFTDNALSEANAKFGFKLLAELYN Q K P N K N V F I S P L S I S I A L T Met T Y N G A R G A T K Q A Met A K T L E I E G Met D L G A V N Q A N A E L R E I L K S A D P Q I E L A I A N S I W L R N T F D E VNPDFLDRNDRFFGAEIASLDFDDPQTVETINQWVNTNTQG K I K E I L G E I E E H E V Met F L I N A I Y F K G G W K G K F D A S K T Q D G V F H L L D G G E K Q V P Met Met S H T C N Y S Y L E S G D F R A V G L P Y G E G R V S Met Y I F L P E H S S N L D E F L A D L N A E N W E N W L S R F W N E R D L R F I Met P R F R L E Y G Met L L N D A L K A L G Met E I A F I P Y V A N L E G I A P LLFIEKVIHKTFLEVNEEGTEAAAVTLVSPPPASTPGPFVVN R P F F F A I H D N W T N T I L F Met G I V V E P MetStop 28 So sánh trình tự acid amin nhằm tìm kiếm chức gen tương đồng ngân hàng liệu Uniprot Phụ lục 12 So sánh kết giải trình tự gen tách dịng pUC57, pET32a(+) với gen đích Chú thích: gen MK359987.1 mã số trình tự gen đích đăng ký NCBI 29 Phụ lục 13 Các phương pháp sử dụng thu hồi nhận diện protein PI-QT 13.1 Thu protein từ môi trường nuôi cấy phương pháp tủa muối Môi trường nuôi cấy tế bào ly tâm 5000 v/p, 10 phútthu dịch Sau tủa protein muối (NH2)2SO4 Phương pháp tủa sử dụng tương đối rộng rãi để thu nhận phân tử sinh học mà protein Tủa muối phương pháp phổ biến để tủa protein Khả hòa tan protein tùy thuộc vào nhiều yếu tố: đặc tính lý hóa tự nhiên protein, pH, nhiệt độ, nồng độ muối… Ở nồng độ muối thấp, tính tan protein tăng nhẹ (salting in) Tuy nhiên, nồng độ muối cao, tính tan protein giảm mạnh (salting out).Vì vậy, muốn tách protein từ hỗn hợp gồm nhiều protein khác nhau, ta lựa chọn nồng độ muối thích hợp cho phù hợp với protein mục tiêu Tiến hành tủa protein dải nồng độ muối khác điều kiện ºC với loại muối (NH2)2SO4 loại Trung Quốc, loại hãng Merk (Đức) Nồng độ Khối lượng muối; thể tích cuối 0-30 % 16.98 g; 109.02 ml 30-50 % 12.04 g; 106.39 ml 50-75 % 16.36 g; 108.69 ml 75-100 % 17.92 g; 109.52 ml Bổ sung lượng muối cần thiết vào phần dịch sau ly tâm, lắc ºC, vòng 12 h Ở nồng độ muối, sau tủa tiến hành thu dịch tủa ly tâm 12000 v/p 30 phút ºC để thu protein Sau đó, lượng tủa protein hòa lại đệm Tris/HCl 50 mM, pH 7.0, vortex cho tan ly tâm lần để loại bỏ cặn cịn sót lại Các hỗn hợp protein tủa nồng độ khác kiểm tra điện di SDS-PAGE.Sau dựa vào kích thước lý thuyết protein quan tâm, cắt băng 30 protein khỏi gel tiến hành thủy phân, tách chiết protein để nhận diện khối phổ MS/MS 13.2 Tinh protein sắc ký lọc gel với cột Sephacryl-S200 hệ thống FPLC Sắc ký lọc gel dùng để phân tách phân tử dựa khác kích thước phân tử Hỗn hợp protein thu sau tủa với muối (NH4)2SO4được loại muối phương pháp thẩm tích ºC 24 h Dịch protein sau loại muối cho qua cột sắc kí lọc gel với chất giá Sephacryl-S200 Mẫu hệ thống mẫu tự động FPLC với tốc độ dòng 0.5 ml/ phút dung dịch đệm Tris/HCl 50mM pH 7.0 có bổ sung Sodium azide (NaN3) 0.2 %,thu phân đoạn ml Kiểm tra phân đoạn điện di SDS-PAGE Sau gộp phân đoạn chứa protein quan tâm cho qua màng lọc cut off 30 kDa (Microcon-30kDa Centrifugal Filter Unit) sản phẩm thu gồm phần: phần hỗn hợp protein< 30 kDa phần >30 kDa.2 phần sản phẩm kiểm tra điện di SDS-PAGE Dựa vào kích thước tính tốn lý thuyết protein quan tâm, tiến hành nhận diện băng protein phương pháp thủy phân gel, tách chiết nhận diện protein mục tiêu phân tích khối phổ MS (quy trình mục 5.4) 13.3 Thu protein từ vi khuẩn E coli Thu 1L dịch tế bào ly tâm 4000 v/p 10 phút ºC loại mơi trường Cặn tế bào rửa hịa lại 100 mL dung dịch đệm lysis buffer (Tris/HCl 50mM, Triton X-100 0.5 %, lysozyme 10 µg/mL, pH 7.0) ủ 30ºC 30 phút Sau tế bào phá vỡ siêu âm với xung ngắn (200-300 µA) khoảng 3s đá lạnh Siêu âm dịch tế bào hết nhầy tan Tiếp tục ly tâm dịch tế bào 14000 v/p, 30 phút ºC để tách phần dịch cặn tế bào.Kiểm tra điện di phần dịch cặn tế bào điện di SDS-PAGE.Đưa phần dịch qua cột sắc kí lực Ni-NTA agarose rửa protein không bám đệm Tris HCL 50 mM với mM Imidazol.Protein bám cột Imidazol với nồng độ ,100 mM, 300 mM 500 mM Các phân đoạn sau tinh kiểm tra điện di SDS-PAGE 31 Sau băng protein quan tâm phương pháp thủy phân gel, tách chiết nhận diện protein mục tiêu phân tích khối phổ MS (quy trình mục 5.4) 13.4 Nhận diện phân tích protein phương pháp proteomics/tin sinh học Nhận dạng protein khối phổ: Quá trình thực khối phổ liên tiếp tiến hành máy khối phổ QSTAR - XL, vận hành chế độ IDA (Information Dependent Acquisition) để thực việc chuyển từ quét phổ TOF MS đơn ion nằm dải khối (TOF mass) từ 400 đến 1200 sang khối phổ liên tiếp ion phân tử có mật độ cao lớn 15 xác định tự động nhờ phần mềm BioAnalyst QS v1.4 (AppliedBiosystems, Mỹ) Sai số khối (mass tolerance) đặt mức 100 ppm, thời gian thực không lặp lại MS/MS mảnh 90 giây Hiệu điện đặt để ion hoá mẫu dung dịch từ đầu Fused Silica PicoTip 2200V Các protein nhận dạng thông qua phần mềm Mascot v1.8 (MatrixScience Ltd., London, Anh) Tìm kiếm protein phần mềm Mascot v1.8 : Dữ liệu phổ khối (MS/MS) phân tích phần mềm Mascot v1.8 Đây phần mềm có khả phân tích liệu phổ MS/MS để nhận dạng protein dựa thuật toán Mowse phát triển Matrix Science (Matrix Science Ltd., London, Anh) (Pappin et al., 1993) Ngân hàng Dữ liệu dùng để tìm kiếm Mascot Uniprot, Ngân hàng Dữ liệu protein khơng lặp lại tồn diện hệ protein người cài đặt máy tính HP Proliant Server (s/n:2UA5100LXZ) Các thơng số tìm kiếm phần mềm Mascot sau: Enzyme thủy phân: Trypsin; Sai số khối lượng peptide: ± 0,5 Da; Sai số khối lượng mảnh ion phổ MS/MS: ± 0,5 Da; Trạng thái điện tích ion phân tử chọn: + 2,+ 3, +4; Cải biến cố định: Carbamindomethyl (C); Cải biến biến đổi: oxy hóa (methionin) xảy q trình thủy phân; 32 Mức độ xác đặt mặc định: 99,5 % Việc phân tích liệu phổ khối giới hạn Ngân hàng Dữ liệu protein vi sinh vật toàn Ngân hàng Dữ liệu Uniprot Với thông số phần mềm Mascot đưa protein/peptide có điểm số > 30 đảm bảo độ tương đồng cao phổ thực nghiệm phổ lý thuyết với mức ý nghĩa p < 0,05 Sau đó, protein xác nhận lại phần mềm Peak (Canada) 33 Phụ lục 14: Phân tích nhận diện phổ MS/MS mảnh peptide từ protein tái tổ hợp thủy phân Trypsin Coverage: 30.3% 34 ... luận án với tên đề tài: “Sàng lọc biểu gen mã hóa protein ức chế protease vi sinh vật liên kết hải miên Spheciospongia vesparium thu nhận vùng biển Miền Trung, Vi? ??t Nam? ?? 2 Mục tiêu đề tài luận án. .. lọc gen liên quan đến sinh tổng hợp chất có hoạt tính ức chế protease từ vi sinh vật liên kết hải miên thu nhận từ biển Miền Trung, Vi? ??t Nam phương pháp metagenomics Sau biểu gen chọn lọc in vitro... dạng sinh học vi sinh vật liên kết với hải miên Từ CSDL metagenomics khai thác gen liên quan đến sinh tổng hợp chất có hoạt tính ức chế protease Nghiên cứu biểu gen mã hóa protein ức chế protease