Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 58 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
58
Dung lượng
7,32 MB
Nội dung
BỘ Y TẾ TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI PHẠM THỊ XUÂN ÁI Mã sinh viên: 1201036 G–QUADRUPLEX TRÊN NHIỄM SẮC THỂ CỦA VI KHUẨN: PHÂN BỐ VÀ TRÌNH TỰ NUCLEOTID KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ HÀ NỘI – 2017 BỘ Y TẾ TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI PHẠM THỊ XUÂN ÁI Mã sinh viên: 1201036 G–QUADRUPLEX TRÊN NHIỄM SẮC THỂ CỦA VI KHUẨN: PHÂN BỐ VÀ TRÌNH TỰ NUCLEOTID KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ Người hướng dẫn: TS Đỗ Ngọc Quang Nơi thực hiện: Bộ môn Vi sinh Sinh học HÀ NỘI – 2017 LỜI CẢM ƠN Trong trình học tập trường hoàn thành khoá luận này, nhận nhiều giúp đỡ gia đình, thầy cô bạn bè Tôi xin gửi lời cảm ơn chân thành sâu sắc đến TS Đỗ Ngọc Quang Thầy tận tình bảo, hướng dẫn tạo cho nguồn động lực để làm việc phấn đấu vươn lên Tôi xin trân trọng cảm ơn thầy cô cán Trường Đại học Dược Hà Nội dạy dỗ, quan tâm suốt năm học tập trường Cuối cùng, xin bày tỏ lòng biết ơn sâu sắc tới gia đình bạn bè đồng hành bên lúc khó khăn, bận rộn để hoàn thành khoá luận tốt nghiệp Hà Nội, ngày 18 tháng 05 năm 2017 Sinh viên Phạm Thị Xuân Ái MỤC LỤC ĐẶT VẤN ĐỀ CHƯƠNG TỔNG QUAN 1.1 Vai trò sinh học G-quadruplex 1.2 Cấu trúc G-quadruplex 1.3 Phân bố G-quadruplex sinh vật nhân thực sinh vật nhân sơ 1.4 Các thuật toán tìm kiếm G-quadruplex gen 10 1.5 Xác định mô-típ trình tự nucleic acid nucleic 11 CHƯƠNG ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 13 2.1 Đối tượng 13 2.2 Phương pháp nghiên cứu 15 2.2.1 Xây dựng sở liệu G4 16 2.2.2 Khảo sát phân bố đoạn G4 17 2.2.3 Khảo sát mô-típ đoạn G4 20 CHƯƠNG KẾT QUẢ 21 3.1 Xây dựng sở liệu G4 21 3.1.1 Khảo sát chiều dài đoạn lặp guanin 21 3.1.2 Khảo sát khoảng cách đoạp lặp guanin 22 3.1.3 Xây dựng thuật toán tìm kiếm đoạn G4 nhiễm sắc thể 23 3.1.4 3.2 3.3 Cơ sở liệu G4 25 Phân bố đoạn G4 nhiễm sắc thể 28 3.2.1 Tần số xuất đoạn G4 so với tỷ lệ %GC 28 3.2.2 Tần số xuất đoạn G4 gen khác 29 Mô-típ đoạn G4 nhiễm sắc thể 30 3.3.1 Chiều dài đoạn guanin đoạn nối 31 3.3.2 Mô-típ đoạn nối 32 KẾT LUẬN VÀ ĐỀ XUẤT 34 4.1 Kết luận 34 4.2 Đề xuất 35 Phụ lục A Phân bố G-quadruplex 61 nhiễm sắc thể 54 chủng vi khuẩn I Phụ lục B Mô-típ đoạn nối vị trí 1, có độ dài từ đến 10 nucleotid Phụ lục C Mô-típ đoạn nối có độ dài từ đến 10 nucleotid IV VII DANH SÁCH BẢNG Tham số dùng số thuật toán tìm kiếm G-quadruplex [14] Tên mã NCBI 54 chủng vi khuẩn sử dụng nghiên cứu 24 Số lượng đoạn G4 NST 10 chủng vi khuẩn tìm thuật toán thuật toán Quadbase 13 Kết kiểm tra thuật toán nhiễm sắc thể Escherichia coli UMN026 với số lượng trình tự đoạn G4 biết trước 10 25 Mười nhiễm sắc thể vi khuẩn có nhiều đoạn G4 số nhiễm sắc thể khảo sát 27 DANH SÁCH HÌNH ẢNH Mô hình G-quadruplex hình thành telomere người [27] G-quadruplex telomere ngăn cản hoạt động nuclease [30] G-quadruplex kích thích hình trình khởi đầu chép ADN Gquadruplex gần vị trí khởi đầu phiên mã kích thích trình hình thành phức hợp khởi đầu chép dẫn đến tăng cường chép ADN [30] G-quadruplex ngăn cản hoạt động ADN polymerase [30] Gquadruplex cản trở di chuyển ADN polymerase dẫn đến ức chế chép ADN Mô hình G-tetrad [27] Phân loại G-quadruplex theo hướng sợi đơn acid nucleic Từ trái sang phải: dạng song song, dạng 3+1, dạng phản song song 1, dạng phản song song [27] Các loại vòng nối G-quadruplex Từ trái sang phải: vòng nối nối hai sợi phản song song đường chéo, vòng nối bên nối hai sợi phản song song liền kề, vòng nối nối hai sợi song song cạnh [27] 8 Vị trí G-quadruplex so với điểm khởi đầu phiên mã [13] 9 Phân tích mô-típ cho thấy trình tự nucleotid bảo thủ hộp TATA genom Escherichia coli 12 10 Tần số xuất đoạn lặp guanin có chiều dài khác nhiễm sắc thể 54 chủng vi khuẩn (đường nét liền) nhiễm sắc thể đối chứng với trình tự nucleotid ngẫu nghiên (đường nét đứt) 11 22 Tần số xuất đoạn nối có chiều dài khác nhiễm sắc thể 54 chủng vi khuẩn (đường nét liền) nhiễm sắc thể đối chứng với trình tự nucleotid ngẫu nghiên (đường nét đứt) 12 23 Nhiễm sắc thể Staphylococcus epidermidis ATCC 12.228: (a) toàn nhiễm sắc thể, (b) phân đoạn từ nucleotid 2.223.200 đến 2.250.000 Các vạch số thể vị trí đoạn G4 nhiễm sắc thể 13 26 (a) Số lượng đoạn G4 tìm so với tỷ lệ %GC NST 54 chủng vi khuẩn (b) Kết phân tích hồi quy tuyến tính số lượng đoạn G4 tỷ lệ %GC 14 28 Năm gen có tần số xuất đoạn G4 lớn Các đoạn G4 nằm mạch mang mã (+) mạch khuôn (-) 29 15 Phân bố đoạn G4 so với điểm khởi đầu phiên mã 30 16 Tần số xuất đoạn lặp guanin với chiều dài khác tại: (a) vị trí 1, (b) vị trí 2, (c) vị trí (d) vị trí đoạn G4 nhiễm sắc thể 54 chủng vi khuẩn 17 31 Tần số xuất đoạn nối có chiều dài khác tại: (a) vị trí 1, (b) vị trí (c) vị trí đoạn G4 nhiễm sắc thể 54 chủng vi khuẩn 32 18 19 Mô-típ đoạn nối có độ dài nucleotid tại: (a) vị trí 1, (b) vị trí (c) vị trí 33 Mô-típ đoạn nối có độ dài từ đến nucleotid 33 DANH SÁCH TỪ VIẾT TẮT ADN Acid deoxyribonucleic ARN Acid ribonucleic NST Nhiễm sắc thể G4 G-quadruplex DNA Pol ADN polymerase ORF Khung đọc mở SD Độ lệch chuẩn Mean Giá trị trung bình tARN Transfer RNA 10 gtlJ Glutamate/Aspartate import permease 11 serA D-3-phosphoglycerate dehydrogenase 12 gidA Glucose-inhibited division protein A 13 def Peptide deformylase 14 TMPyP4 5,10,15,20-tetra(N-methyl-4-pyridyl) porphin KẾT LUẬN VÀ ĐỀ XUẤT 4.1 Kết luận Sau thực đề tài, thu kết sau: • Đã xây dựng thuật toán lập đồ đoạn ADN có khả tạo G-quadruplex (đoạn G4) với liệu đầu vào trình tự nucleotid hệ gen sinh vật lấy từ ngân hàng NCBI liệu đầu gồm trình tự nucleotid vị trí đoạn G4 tìm thấy • Đã lập đồ 1.304.141 đoạn G4 61 nhiễm sắc thể 54 chủng vi khuẩn nghiên cứu nhiều theo PubMed • Đã xác định mối tương quan tần số xuất đoạn G4 với %GC 61 nhiễm sắc thể theo công thức: log(G4) = 4,308*log(%GC) - 3,45 (R2 = 0,77) • Đã xác định năm gen có tần số xuất đoạn G4 nhiều bao gồm: gen tARN, gen gtlJ, gen serA, gen gidA, gen def • Đã xác định đoạn G4 phân bố đồng mạch mang mã mạch khuôn; 99,98% đoạn G4 nằm phía trước vùng mang mã gen, tập trung chủ yếu khoảng 2.000 bp phía trước điểm khởi đầu phiên mã 34 • Đã xác định số mô-típ chung đoạn G4 thu được: ∼ 90% guanin tập trung thành cụm từ 2-4 nucleotid; cytosin thymin có tần số xuất vị trí đầu cuối lớn vị trí khác đoạn nối 4.2 Đề xuất Sau hoàn thành nghiên cứu, xin đưa số đề xuất sau: • Xác định cấu trúc không gian thay đổi hình dạng đoạn G4 vị trí khác nhiễm sắc thể • Tiến hành thí nghiệm để nghiên cứu đặc tính sinh học chức đoạn G4 tìm • Xây dựng phân loài để xác định mối quan hệ chủng vi khuẩn nghiên cứu Từ tìm quy luật bảo tồn đoạn G4 theo loài 35 Tài liệu [1] (2017) ?iiTb,ffrrrXM+#BXMHKXMB?X;Qpf;2MQK2f#`Qrb2f [Online; accessed 23-April-2017] [2] (2017) ?iiT,ff[m/#b2XB;B#X`2bXBMfh2i`SH2t6BM/2` [Online; accessed 23-April-2017] [3] Bochman, M L., Paeschke, K., and Zakian, V A (2012) “DNA secondary structures: stability and function of G-quadruplex structures” Nature Reviews Genetics, 13(11):770–780 [4] Brendel, V (1985) “Mapping of transcription terminators of bacteriophages phi X174 and G4 by sequence analysis.” Journal of virology, 53(1):340–342 [5] Brendel, V and Trifonov, E (1984) “A computer algorithm for testing potential prokaryotic terminators” Nucleic acids research, 12(10):4411–4427 [6] Cock, P J., Antao, T., Chang, J T., Chapman, B A., Cox, C J., Dalke, A., Friedberg, I., Hamelryck, T., Kauff, F., Wilczynski, B., et al (2009) “Biopython: freely available Python tools for computational molecular biology and bioinformatics” Bioinformatics, 25(11):1422–1423 [7] David, A P., Margarit, E., Domizi, P., Banchio, C., Armas, P., and Calcaterra, N B (2016) “G-quadruplexes as novel cis-elements controlling transcription during embryonic development” Nucleic acids research, 44(9):4163–4173 [8] D’haeseleer, P (2006) “What are DNA sequence motifs?” Nature biotechnology, 24(4):423–425 [9] Du, X., Wojtowicz, D., Bowers, A A., Levens, D., Benham, C J., and Przytycka, T M (2013) “The genome-wide distribution of non-B DNA motifs is shaped by operon structure and suggests the transcriptional importance of non-B DNA structures in Escherichia coli” Nucleic acids research, 41(12):5965–5977 [10] Guo, J U and Bartel, D P (2016) “RNA G-quadruplexes are globally unfolded in eukaryotic cells and depleted in bacteria” Science, 353(6306):aaf5371 [11] Hänsel-Hertsch, R., Di Antonio, M., and Balasubramanian, S (2017) “DNA G-quadruplexes in the human genome: detection, functions and therapeutic potential” Nature Reviews Molecular Cell Biology, 18(5):279–284 [12] Harris, L M and Merrick, C J (2015) “G-quadruplexes in pathogens: a common route to virulence control?” PLoS Pathog, 11(2):e1004562 [13] Hershman, S G., Chen, Q., Lee, J Y., Kozak, M L., Yue, P., Wang, L.-S., and Johnson, F B (2008) “Genomic distribution and functional analyses of potential G-quadruplex-forming sequences in Saccharomyces cerevisiae” Nucleic acids research, 36(1):144–156 [14] Huppert, J (2008) “Hunting G-quadruplexes” Biochimie, 90(8):1140– 1148 [15] Huppert, J L and Balasubramanian, S (2005) “Prevalence of quadruplexes in the human genome” Nucleic acids research, 33(9):2908–2916 [16] Huppert, J L and Balasubramanian, S (2007) “G-quadruplexes in promoters throughout the human genome” Nucleic acids research, 35(2):406– 413 [17] Huppert, J L., Bugaut, A., Kumari, S., and Balasubramanian, S (2008) “G-quadruplexes: the beginning and end of UTRs” Nucleic acids research, 36(19):6260–6268 [18] Jia, S.-M., Liu, X.-F., Li, P., Kong, D.-M., and Shen, H.-X (2011) “G-quadruplex DNAzyme-based Hg 2+ and cysteine sensors utilizing Hg 2+-mediated oligonucleotide switching” Biosensors and Bioelectronics, 27(1):148–152 [19] Kaplan, O I., Berber, B., Hekim, N., et al (2015) “G-quadruplex prediction in E coli genome reveals a conserved putative G-quadruplex-HairpinDuplex switch” bioRxiv, page 032615 [20] Kikin, O., D’Antonio, L., and Bagga, P S (2006) “QGRS Mapper: a webbased server for predicting G-quadruplexes in nucleotide sequences” Nucleic acids research, 34(suppl 2):W676–W682 [21] Kikin, O., Zappala, Z., D’Antonio, L., and Bagga, P S (2008) “GRSDB2 and GRS_UTRdb: databases of quadruplex forming G-rich sequences in premRNAs and mRNAs” Nucleic acids research, 36(suppl 1):D141–D148 [22] Lexa, M., Steflova, P., Martinek, T., Vorlickova, M., Vyskot, B., and Kejnovsky, E (2014) “Guanine quadruplexes are formed by specific regions of human transposable elements” BMC genomics, 15(1):1 [23] McKinney, W (2012) “Python for data analysis: Data wrangling with Pandas, NumPy, and IPython” O’Reilly Media, Inc [24] Métifiot, M., Amrane, S., Litvak, S., and Andreola, M.-L (2014) “Gquadruplexes in viruses: function and potential therapeutic applications” Nucleic acids research, 42(20):12352–12366 [25] Neidle, S (2010) “Human telomeric G-quadruplex: The current status of telomeric G-quadruplexes as therapeutic targets in human cancer” FEBS journal, 277(5):1118–1125 [26] Payet, L and Huppert, J L (2012) “Stability and structure of long intramolecular G-quadruplexes” Biochemistry, 51(15):3154–3161 [27] Phan, A T (2010) “Human telomeric G-quadruplex: structures of DNA and RNA sequences” Febs Journal, 277(5):1107–1117 [28] Prescott, J C and Blackburn, E H (1999) “Telomerase: Dr Jekyll or Mr Hyde?” Current opinion in genetics & development, 9(3):368–373 [29] Qin, Y and Hurley, L H (2008) “Structures, folding patterns, and functions of intramolecular DNA G-quadruplexes found in eukaryotic promoter regions” Biochimie, 90(8):1149–1171 [30] Rhodes, D and Lipps, H J (2015) “G-quadruplexes and their regulatory roles in biology” Nucleic acids research, page gkv862 [31] Safa, L., Gueddouda, N M., Thiébaut, F., Delagoutte, E., Petruseva, I., Lavrik, O., Mendoza, O., Bourdoncle, A., Alberti, P., Riou, J.-F., et al (2016) “5′ to 3′ Unfolding Directionality of DNA Secondary Structures by Replication Protein A G-QUADRUPLEXES AND DUPLEXES” Journal of Biological Chemistry, 291(40):21246–21256 [32] Schneider, T D and Stephens, R M (1990) “Sequence logos: a new way to display consensus sequences” Nucleic acids research, 18(20):6097–6100 [33] Valton, A.-L and Prioleau, M.-N (2016) “G-Quadruplexes in DNA Replication: A Problem or a Necessity?” Trends in Genetics, 32(11):697–706 [34] Venthur, B., Dähne, S., Höhne, J., Heller, H., and Blankertz, B (2015) “Wyrm: A brain-computer interface toolbox in python” Neuroinformatics, 13(4):471–486 [35] Wang, Q., Liu, J.-q., Chen, Z., Zheng, K.-w., Chen, C.-y., Hao, Y.-h., and Tan, Z (2011) “G-quadruplex formation at the 3′ end of telomere DNA inhibits its extension by telomerase, polymerase and unwinding by helicase” Nucleic acids research, page gkr164 [36] Xiao, S., Zhang, J.-y., Zheng, K.-w., Hao, Y.-h., and Tan, Z (2013) “Bioinformatic analysis reveals an evolutional selection for DNA: RNA hybrid Gquadruplex structures as putative transcription regulatory elements in warmblooded animals” Nucleic acids research, 41(22):10379–10390 [37] Yadav, V K., Abraham, J K., Mani, P., Kulshrestha, R., and Chowdhury, S (2008) “QuadBase: genome-wide database of G4 DNA—occurrence and conservation in human, chimpanzee, mouse and rat promoters and 146 microbes” Nucleic acids research, 36(suppl 1):D381–D385 PHỤ LỤC A Phân bố G-quadruplex 61 nhiễm sắc thể 54 chủng vi khuẩn I II III B Mô-típ đoạn nối vị trí 1, có độ dài từ đến 10 nucleotid (a) Đoạn nối (b) Đoạn nối IV (c) Đoạn nối V VI C Mô-típ đoạn nối có độ dài từ đến 10 nucleotid VII ... lượng nucleotid nhiễm sắc thể Đếm số lượng đoạn GG, GGG, GGGG, GGGGG, GGGGGG, GGGGGGG, GGGGGGGG, GGGGGGGGG, GGGGGGGGGG 2: end for 3: for k ∈ {1, , N M } ◃ Nn số lượng đoạn Gn với n từ đến 10... G- quadruplex cho vi khuẩn Để phần giải vấn đề trên, thực đề tài nghiên cứu G- quadruplex nhiễm sắc thể vi khuẩn: phân bố trình tự nucleotid với hai mục tiêu: • Xây dựng sở liệu vị trí trình tự. .. TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI PHẠM THỊ XUÂN ÁI Mã sinh vi n: 1201036 G QUADRUPLEX TRÊN NHIỄM SẮC THỂ CỦA VI KHUẨN: PHÂN BỐ VÀ TRÌNH TỰ NUCLEOTID KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ Người hướng dẫn: TS Đỗ Ngọc