1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu sự thay đổi của các trimer trong các quá trình tự protein sense và antisense trong quá trình tiến hóa của các vi khuẩn thuộc họ burkholderiaceae

73 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 73
Dung lượng 1,81 MB

Nội dung

ĐẠI HỌC QUỐC GIA TP HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA PHẠM TÂM TÌNH NGHIÊN CỨU SỰ THAY ĐỔI CỦA CÁC TRIMER TRONG CÁC TRÌNH TỰ PROTEIN SENSE VÀ ANTISENSE TRONG Q TRÌNH TIẾN HĨA CỦA CÁC VI KHUẨN THUỘC HỌ BURKHOLDERIACEAE Chuyên ngành: Công nghệ Sinh học Mã số: 604 02 01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 01 năm 2020 CƠNG TRÌNH ĐƢỢC HỒN THÀNH TẠI TRƢỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG –HCM Cán hƣớng dẫn khoa học: TS Phan Thị Huyền (Ghi rõ họ, tên, học hàm, học vị chữ ký) Cán chấm nhận xét 1: TS Nguyễn Hoàng Chƣơng (Ghi rõ họ, tên, học hàm, học vị chữ ký) Cán chấm nhận xét 2: TS Nguyễn Tiến Dũng (Ghi rõ họ, tên, học hàm, học vị chữ ký) Luận văn thạc sĩ đƣợc bảo vệ Trƣờng Đại học Bách Khoa, ĐHQG Tp HCM ngày 14 tháng 01 năm 2020 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: (Ghi rõ họ, tên, học hàm, học vị Hội đồng chấm bảo vệ luận văn thạc sĩ) Chủ tịch: PGS TS Nguyễn Đức Lƣợng Thƣ ký: PGS TS Lê Thị Thủy Tiên Phản biện 1: TS Nguyễn Hoàng Chƣơng Phản biện 2: TS Nguyễn Tiến Dũng Ủy viên: TS Phan Thị Huyền Xác nhận Chủ tịch Hội đồng đánh giá LV Trƣởng Khoa quản lý chuyên ngành sau luận văn đƣợc sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƢỞNG KHOA i ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÕA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Phạm Tâm Tình MSHV: 1670510 Ngày, tháng, năm sinh: 23/01/1985 Nơi sinh: Đồng Nai Chuyên ngành: Công nghệ Sinh học Mã số : 604 02 01 TÊN ĐỀ TÀI: Nghiên cứu thay đổi trimer trình tự protein sense antisense trình tiến hóa vi khuẩn thuộc họ Burkholderiaceae NHIỆM VỤ VÀ NỘI DUNG: Xác định mật độ phân bố trimer trình tự protein sense antisense hai replichore nhiễm sắc thể vi khuẩn thuộc họ Burkholderiaceae Khảo sát mức độ thay đổi mật độ trimer trình tự protein sense antisense vi khuẩn thuộc họ Burkholderiaceae q trình tiến hóa NGÀY GIAO NHIỆM VỤ :(Ghi theo QĐ giao đề tài) 19/08/2019 NGÀY HOÀN THÀNH NHIỆM VỤ:(Ghi theo QĐ giao đề tài) 08/12/2019 CÁN BỘ HƢỚNG DẪN (Ghi rõ học hàm, học vị, họ, tên): TS Phan Thị Huyền Tp HCM, ngày 14 tháng 01 năm 2020 CÁN BỘ HƢỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO (Họ tên chữ ký) (Họ tên chữ ký) TS Phan Thị Huyền PGS.TS Lê Thị Thủy Tiên TRƢỞNG KHOA (Họ tên chữ ký) GS.TS Phan Thanh Sơn Nam ii LỜI CẢM ƠN Để hoàn thành đề tài luận văn thạc sĩ này, em xin gửi lời cảm ơn sâu sắc tới: Cơ Phan Thị Huyền, người Cơ đáng kính với dẫn khoa học quý báu, theo sát dìu dắt em hồn thành đề tài luận văn thạc sĩ Em xin cảm ơn tất Thầy, Cô môn Công nghệ sinh học-Khoa Kỹ thuật Hóa học truyền đạt cho em kiến thức khoa học suốt hai năm em ngồi ghế giảng đường Cảm ơn tất bạn học lớp Cao học Khóa 2016 ln quan tâm, giúp đỡ cho em thật nhiều niềm vui kỉ niệm đáng quý suốt thời gian học tập mái trường Đại học Bách Khoa thành phố Hồ Chí Minh Cảm ơn đồng nghiệp sát cánh, giúp đỡ công việc để tạo điều kiện thuận lợi suốt trình học tập Và hết, hai gia đình lớn gia đình nhỏ ln bên cạnh, động viên, chăm lo cổ vũ để em vượt giai đoạn khó khăn sống Mọi người niềm yêu thương vô bờ bến Cầu chúc cho điều tốt đẹp đến với người Hy vọng đoạn đường tới, ln có người bên cạnh Xin chân thành cảm ơn tất cả! Phạm Tâm Tình iii MỞ ĐẦU Từ năm cuối kỷ 20, di truyền học kỹ thuật gene phát triển nhanh chóng đạt đƣợc nhiều thành tựu to lớn Sự phát triển giúp cho ngƣời ngày hiểu rõ sở khoa học sống Và hiểu biết đóng góp vai trị lớn lĩnh vực chăm sóc bảo vệ sức khoẻ ngƣời Chẳng hạn, việc chẩn đốn, dự phịng, trị liệu, từ nâng cao chất lƣợng sống bảo vệ môi trƣờng thiên nhiên Đi kèm với phát triển lĩnh vực sinh học, vấn đề đặt tham gia ngành khoa học khác, đặc biệt ngành khoa học máy tính Ngành sinh học phân tử phát triển, đòi hỏi hỗ trợ lớn từ phía tin học, qua giải toán lớn phức tạp nhằm phục vụ cho hiểu biết ngƣời giới sinh vật, nhƣ thân ngƣời Sự thành công dự án nghiên cứu gene, với hỗ trợ công cụ tin học, dẫn đến thay đổi lớn việc nghiên cứu vấn đề liên quan đến sinh học Ngƣời ta chuyển dịch dần từ quan tâm cấu trúc đa phân tử sinh học sang phân tích trình tự sinh học phƣơng tiện tin học Phƣơng tiện tin học dừng lại việc tạo sở liệu lớn, mà tạo cơng cụ hữu hiệu để phân tích tìm hiểu trình tự nhƣ cấu trúc đại phân tử sinh học, đồng thời cịn giúp phân tích đánh giá q trình tiến hóa sinh vật thơng qua việc tìm kiếm so sánh trình tự đại phân tử sinh học Phân tích so sánh trình tự cơng việc tin sinh học Cho dù nhằm mục đích dự đốn cấu trúc protein, phân tích đa dạng sinh học hay làm sáng tỏ lịch sử tiến hóa gene quan tâm, phải làm việc đối tƣợng trình tự sinh học, tìm kiếm thay đổi trình tự trình tiến hóa giống, lồi, hay gene với Tuy nhiên, để phân tích đánh giá q trình tiến hóa sinh vật, cần thiết phải có cơng cụ tin học chuẩn xác phục vụ cho công việc xem xét, đánh giá mức độ thay đổi đại phân tử trình tiến hóa Cơng việc thiết lập cơng cụ địi hỏi tảng hiểu biết tiến hóa trình tự đại phân tử sinh học Thế nhƣng, tiến hóa xảy nhƣ cịn vấn đề chƣa đƣợc kết luận thức Vì thế, khơng ngạc nhiên có nhiều nghiên cứu nổ lực đƣa mơ hình tiến hóa, cho đời iv thực thi thành cơng số cơng cụ phân tích trình tự nhằm khám phá đƣợc nhiều thơng tin từ liệu trình tự, chẳng hạn nhƣ ma trận điểm số tích hợp chƣơng trình tìm kiếm trình tự tƣơng đồng sở liệu (CSDL) sinh học hay chƣơng trình xác định mối quan hệ tiến hóa trình tự sinh học Tuy nhiên, gia tăng ngày lớn số lƣợng trình tự đại phân tử sinh học CSDL cho thấy công cụ chƣa đánh giá mối quan hệ tiến hóa trình tự Do đó, cần thiết phải nghiên cứu sâu tiến hóa trình tự đại phân tử sinh học nhằm hƣớng đến mục tiêu tạo đƣợc ma trận điểm số chuẩn xác sử dụng đánh giá phân tích tiến hóa Để hƣớng đến mục tiêu đó, nghiên cứu tiến hành trích xuất trình tự protein sense antisense từ trình tự nhiễm sắc thể hồn chỉnh vi khuẩn thuộc họ Burkholderiaceae có CSDL NCBI, sau nghiên cứu khảo sát mức độ thay trimer (tƣơng ứng với codon trình tự mRNA) vi khuẩn họ tiến hóa v TĨM TẮT LUẬN VĂN Ma trận điểm số có vai trị quan trọng ngành khoa học nghiên cứu tiến hóa mức độ phân tử PAM BLOSUM ma trận điểm số amino acid đƣợc tích hợp công cụ phổ biến để phục vụ gióng cột trình tự, có ý nghĩa thiết thực tìm kiếm trình tự tƣơng đồng sở liệu, nghiên cứu so sánh gene nghiên cứu mối quan hệ tiến hóa loài Các ma trận đƣợc thiết lập từ số lƣợng lớn trình tự có sẵn sở liệu, nhiên chƣa đủ nhạy để phản ánh xác thật, phƣơng thức thiết lập ma trận chƣa tính đến vị trí trình tự gene nhƣ khoảng cách tiến hóa lồi Trong đó, mật độ trimer đại lƣợng mang tính đặc trƣng lồi, có khả phân loại tốt loài mức dƣới giống Chúng tơi xác định mật độ trimer trình tự protein sense antisense vi khuẩn thuộc họ Burkholderiaceae để từ xác định mức độ thay đổi mật độ trimer vi khuẩn họ tiến hóa Kết nghiên cứu cho thấy q trình tiến hóa, nhiễm sắc thể vi khuẩn ln bảo tồn tính tƣơng đồng mật độ trimer trình tự protein sense replichore mật độ trimer BSĐN tƣơng ứng trình tự protein antisense replichore lại nhiễm sắc thể Các lồi khác có số lƣợng trimer cụ thể có mức độ thay đổi mật độ phân bố khác trình tự protein sense antisense hai replichore Mật độ trimer trình tự protein sense mật độ trimer BSĐN tƣơng ứng trình tự protein antisense thay đổi so với mật độ trimer trình tự protein antisense mật độ trimer BSĐN trình tự protein sense Trên replichore, trimer có tỉ lệ mật độ tăng (hoặc giảm) khác nhƣng tổng mật độ tăng luôn tổng mật độ giảm Các kết sở quan trọng để thiết lập ma trận điểm số codon nghiên cứu vi SUMMARY Scoring matrix plays an important role in studies on evolution at the molecular level PAM and BLOSUM are amino acid scoring matrices integrated into the most popular tools to enable sequence alignment, having a significant support in sequence similariry searches on the biological databases, in genomic sequence comparisons and in phylogenetic studies These matrices are established on the basis of a huge amount of sequences available on the databases However, they are not sensitive enough to accurately reflect the true evolutionary process, that is because the establishment procedures have not accounted for genomic positions of the sequences as well as the evolutionary distances among the species Meanwhile, trimer densities are speciesspecific, which can effectively distinguish the organisms below genus level We determine densities of trimers in the protein sense and antisense sequences in the bacteria belonging to the Burkholderiaceae family thereby to determine changes in trimer densities when the bacteria in this family evolve The results show that the chromosomes always maintain the similariy between densities of trimers in the protein sense sequences on a replichore and those of their respective reverse complements in the protein antisense sequences on the other replichore Different species having trimers with different changes in densities in the protein sense and antisense on both replichores Densities of trimers in the protein sense sequences and those of their respective reverse complements in the protein antisense sequences change less in comparison with the densities of trimers in the protein antisense sequences and those of their respective reverse complements in the protein sense sequences On each replichore, different trimers have different rates of change in density, however, total density change that is increased is always equal to the total density change that is decreased These results will be an important basis for establishing codon scoring matrices in subsequent studies vii LỜI CAM ĐOAN Tôi tên Phạm Tâm Tình, học viên cao học ngành Cơng nghệ Sinh học, Khóa 2016 đợt 1, Khoa Kỹ thuật Hóa học, Trƣờng đại học Bách khoa Thành phố Hồ Chí Minh, xin cam đoan cơng trình nghiên cứu tơi thực hiện, số liệu kết nghiên cứu thực dƣới hƣớng dẫn khoa học TS Phan Thị Huyền Tơi xin chịu hồn toàn trách nhiệm kết nghiên cứu luận văn tốt nghiệp Tp Hồ Chí Minh, ngày 14 tháng 01 năm 2020 Học viên thực Phạm Tâm Tình viii CÁC TỪ VIẾT TẮT DNA Deoxyribonucleic acid A Adenine C Cytosine G Guanine T Thymine BSĐN Bổ sung đảo ngƣợc bp Base pair kbp Kilo base pair rRNA ribosomal RNA mRNA RNA thông tin tRNA RNA vận chuyển CSDL Cơ sở liệu NCBI National Center for Biotechnology Information ix CHƢƠNG KẾT LUẬN VÀ KIẾN NGHỊ 4.1 KẾT LUẬN Các vi khuẩn thuộc họ Burkholderiaceae tiến hóa: Nhiễm sắc thể vi khuẩn ln bảo tồn tính tƣơng đồng mật độ trimer trình tự protein sense replichore mật độ trimer BSĐN tƣơng ứng trình tự protein antisense replichore lại nhiễm sắc thể Mật độ phân bố tất trimer có thay đổi tăng thay đổi giảm Các lồi khác có số lƣợng trimer (và trimer BSĐN tƣơng ứng) cụ thể có mức độ thay đổi mật độ phân bố khác trình tự protein sense antisense hai replichore nhiễm sắc thể Mật độ trimer trình tự protein sense mật độ trimer BSĐN tƣơng ứng trình tự protein antisense thay đổi so với mật độ trimer trình tự protein antisense mật độ trimer BSĐN trình tự protein sense Các số lƣợng khác trimer (và trimer BSĐN tƣơng ứng) tăng lên (hoặc giảm đi) mật độ với tỉ lệ mật độ tăng (hoặc giảm) khác tính tổng mật độ tăng (hoặc giảm) cho replichore, với tổng mật độ tăng luôn tổng mật độ giảm tính replichore 4.2 KIẾN NGHỊ Nghiên cứu mức độ thay đổi trimer trình tự protein sense antisense họ vi khuẩn khác 58 TÀI LIỆU THAM KHẢO Watson JD, Crick FHC, 1953 A structure for deoxyribose nucleic acid Nature 171: 737-738 Jukes TH, Cantor CR, 1969 Evolution of protein molecules, in Mammalian Protein Metabolism, ed HM Munro, NewYork, NY: Academic Press, 21-132 Altschul SF, Gish W, Miller W, Myers EU; Lipman DJ, 1990 Basic local alignment search tool J Mol Biol, 215: 403-410 Xiong J, 2006 Essential Bioinformatics Cambridge University Press, NY, USA Dayhoff MO, Schwartz RM, Orcutt BC, 1978 A model of evolutionary change in proteins,” in Atlas of Protein Sequence and Structure, ed MO Dayhoff (Washington DC: National Biomedical Research Foundation), pp 345-352 Henikoff S, Henikoff JG, 1992 Amino acid substitution matrices from protein blocks Proc Natl Acad Sci USA, 89: 10915-10919 Schneider A, Cannarozzi GM, Gonnet GH, 2005 Empirical codon substitution matrix BMC Bioinformatics, 6: 134 Muse SV, Gaut BS, 1994 A likelihood approach for comparing synonymous and nonsynonymous nucleotide substitution rates, with application to the chloroplast genome Mol Biol Evol, 11: 715-724 Kimura, M 1980 A simple method for estimating evolutionary rate of base substitutions through comparative studies of nucleotide sequences J Mol Evol 16: 111-120 10 Collins DW, Jukes TH, 1994 Rates of transition and transversion in coding sequences since the human-rodent divergence Genomics, 20: 386-396 11 Felsenstein J, 1981 Evolutionary trees from DNA sequences: a maximum likelihood approach J Mol Evol, 17: 368-376 12 Hasegawa M, Kishino H, Yano T, 1985 Dating the human-apes plitting by a molecular clock of mitochondrial DNA J Mol Evol, 22: 160-174 13 Zharkikh A, 1994 Estimation of evolutionary distances between nucleotide sequences J Mol Evol, 39: 315-329 14 Tavaré S, 1986 Some probabilistic and statistical problems in the analysis of DNA sequences, in Some Mathematical Questions in Biology-DNA Sequence Analysis, ed RM Miura (Providence, RI:Amer Math Soc), 57-86 15 Shoemaker JS, Fitch WM, 1989 Evidence from nuclear sequences that invariable sites should be considered when sequence divergence is calculated Mol Biol Evol, 6: 270-289 16 Yang Z, 1994 Maximum likelihood phylogenetic estimation from DNA sequences with variable rates over sites: approximate methods J Mol Evol, 39: 306-314 17 Sumner JG, Jarvis PD, Fernández-Sánchez J, Kaine BT, Woodhams MD, Holland BR, 2012 Is the general time-reversible model bad for molecular phylogenetics? Syst Biol, 61: 1069-1074 18 Arenas M, 2015 Trends in substitution models of molecular evolution Front Genet, 6: 319 59 19 Mueller T, Spang R, Vingron M, 2002 Estimating amino acid substitution models: a comparison of Dayhoff's estimator, the resolvent approach and a maximum likelihood method Mol Biol Evol, 19: 8-13 20 Halpern, AL, Bruno WJ, 1998 Evolutionary distances for protein-coding sequences: modeling site-specific residue frequencies Mol Biol Evol, 15: 910917 21 Lartillot N, Philippe H, 2004 A Bayesian mixture model for across-site heterogeneities in the amino-acid replacement process Mol Biol Evol, 21: 1095-1109 22 Zoller S, Schneider A, 2013 Improving phylogenetic inference with a semiempirical amino acid substitution model Mol Biol Evol, 30: 469-479 23 Keane TM, Creevey CJ, Pentony MM, Naughton TJ, Mclnerney JO, 2006 Assessment of methods for amino acid matrix selection their use on empirical data shows that adhoc assumptions for choice of matrix are not justified BMC Evol Biol, 6: 29 24 Taverna DM, Goldstein RA, 2000 The distribution of structures in evolving protein populations Biopolymers, 53: 1-8 25 Parisi G, Echave J, 2005 Generality of the structurally constrained protein evolution model: assessment on representatives of the four main fold classes Gene, 345: 45-53 26 Goldstein RA, 2011 The evolution and evolutionary consequences of marginal thermostability in proteins Proteins, 79: 1396-1407 27 Grahnen JA, Nandakumar P, Kubelka J, Liberles DA, 2011 Biophysical and structural considerations for protein sequence evolution BMC Evol Biol, 11: 361 28 Wilke CO, 2012 Bringing molecules back into molecular evolution PloS Comput Biol, 8: e1002572 29 Arenas M, DosSantos HG, Posada D, Bastolla U, 2013 Protein evolution along phylogenetic histories under structurally constrained substitution models Bioinformatics, 29: 3020-3028 30 Arenas M, Sánchez-Cobos A, Bastolla U, 2015 Maximum likelihood phylogenetic inference with selection on protein folding stability Mol Biol Evol, 32: 2195-2207 31 Bordner AJ, Mittelmann HD, 2013 A new formulation of protein evolutionary models that account for structural constraints Mol Biol Evol, 31: 736-749 32 Benner SA, Cohen MA, Gonnet GH, 1994 Amino acid substitution during functionally constrained divergent evolution of protein sequences Protein Eng, 7: 1323-1332 33 Seo TK, Kishino H, 2008 Synonymous substitutions substantially improve evolutionary inference from highly diverged proteins Syst Biol, 57: 367-377 34 Phan TH, Nguyen DL, 2012 Species-specificity of DNA trimer densities in chromosomes and their use in the classification of closely related organisms J Microbiol Methods, 91: 30-37 35 Phan TH, Tran THT, 2018 Trimer distribution patterns in the protein sense and antisense sequences on the two replichores of the Burkholderia lata chromosomes International Conference on Advanced Computing and 60 Applications (ACOMP) Computer Science and Software Engineering Section, pp 71-75 36 Pearson WR, 2013 Selecting the right similarity-scoring matrix Curr Protoc Bioinformatics, 43: 3.5.1-3.5.9 37 Benner SA, Cohen MA, Gonnet GH, 1994 Amino acid substitution during functionally constrained divergent evolution of protein sequences Protein Eng, 7: 1323-1332 38 Goldman N, Yang Z, 1994 A codon-based model of nucleotide substitution for protein-coding DNA sequences Mol Biol Evol, 11: 725-736 39 Seo TK, Kishino H, 2008 Synonymous substitutions substantially improve evolutionary inference from highly diverged proteins Syst Biol, 57: 367-377 40 Genskew: Harhay GP, Murray RW, Lubbers B, Griffin D, Koren S, Phillippy AM, Harhay DM, Bono J, Clawson ML, Heaton MP, Chitko-McKown CG, Smith TPL, 2014 Completed closed genome sequences of four Mannheimia varigena isolates from cattle with shipping fever Genome Announc, 2: e0008814 41 Rice P, Longden I, Bleasby A, 2000 EMBOSS: the European molecular biology open software suite Trends Genet, 16: 276-277 42 Phan Thi Huyen, Nguyen Duc Luong, 2012 Non-random DNA trimer arrangement in Bacillus cereus ATCC 10987 chromosome Tạp chí Sinh học, 34: 354-361 61 PHỤ LỤC PHỤ LỤC Các bƣớc thiết lập ma trận điểm số BLOSUM [6] Giả sử block (nhƣ tô màu xanh dƣới đây) kết xếp gióng hàng N trình tự có n cột (tức n vị trí bảo tồn) Tổng số cặp amino acid XiXj (khả amino acid Xi chuyển đổi thành amino acid Xj) tổng số cặp trình tự đƣợc gióng, tức t = N(N-1)/2 Bƣớc 1: Tính tần suất xuất Cijk cặp XiXj cột thứ k (1 ≤ k ≤ n) block: Trong cột thứ nhất: AABACA: t = 6(6-1)/2 = 15 Gọi xi, xj Cijk tƣơng ứng tần suất xuất amino acid Xi, amino acid Xj XiXj cột thứ k block: Tần suất xuất cặp XiXi block là: Ciik = xi(xi-1)/2 Tần suất xuất XiXj block là: Cijk = xixj AA AB AC Tần suất xuất xi xj Ciik Cijk 4 (4)(4-1)/2 = (4)(1) = 4 (4)(1) = 62 BB BC CC Tổng 1 1 1 (1)(1-1)/2 = (1)(1) = (1)(1-1)/2 = 15 Bƣớc 2: Tính tổng tần suất xuất Cij cặp XiXj tất n cột block: Cij = Cijk , (1 ≤ k ≤ n) Bƣớc 3: Qui tổng tần suất xuất Cij cặp XiXj Khi đó, tần suất xuất qij cặp XiXj là: qij = Cij/T đó, T = n*t = n*[N(N-1)/2] Ví dụ, tần suất xuất qAB cặp XAXB block là: qAB = (4 + + + + + + 0)/(7*15) = 12/105 = 0.114 Bƣớc 4: Tính tần suất xuất ngẫu nhiên pi amino acid Xi (hay pj amino acid Xj) cặp XiXj block: pi = qii + (qij/2), (i ≠ j) pj = qjj + (qij/2), (i ≠ j) Khi đó: Tần suất xuất ngẫu nhiên cặp XiXi block là: eii = pi*pi = pi2 Tần suất xuất ngẫu nhiên cặp XiXj block là: eij = pi*pj + pj*pi = 2pi*pj, (j ≠ i) Tính tỉ số sij = qij/eij Bƣớc 5: Tính logarith số (hoặc 10) sij Bƣớc 6: Làm tròn giá trị logarith số (hoặc 10) sij số tự nhiên đƣa giá trị làm tròn vào ma trận BLOSUM 63 PHỤ LỤC Mật độ trimer trình tự protein sense antisense R1 nhiễm sắc thể (NC_006348) vi khuẩn B mallei ATCC23344 R1-S_Trimer BSĐN 1.409911 R1-AS_Trimer BSĐN 1.333114 CTT 1.050259 8.661901 TGT 0.221913 0.427309 CGT 1.683476 11.32145 ACT 0.244869 0.260391 2.517115 CAT 2.469736 6.62996 1.47555 AAT 1.67965 1.25967 1.706432 1.622437 TTG 2.127301 2.020813 CAG 9.477204 14.81782 CTG 14.35928 8.635194 CCA 0.244869 4.595793 TGG 4.105386 0.351639 CCG 12.44624 5.190019 CGG 5.477036 12.61451 CCT 0.439999 0.534136 AGG 0.575825 0.454015 CGA 0.992868 8.414863 TCG 9.186422 1.117234 Trimer R1-S_Trimer R1-AS_Trimer AAA 1.073216 1.117234 AAG 8.711988 1.008181 ACA 0.344347 0.153564 ACG 11.96224 1.522287 AGT 0.319478 0.21588 ATG 7.053381 ATT 1.375476 CAA Trimer BSĐN TTT CTA 0.19513 0.104602 TAG 0.101391 0.249263 GAA 5.044689 10.71832 TTC 10.56572 5.835433 GAC 13.06798 11.5952 GTC 11.56816 13.55147 GAG 11.01338 15.47213 CTC 14.64815 10.19086 GAT 5.635818 12.92163 ATC 12.44433 4.996395 GCA 2.00678 3.178108 TGC 3.122083 2.388032 GCG 34.27595 18.81048 CGC 17.64589 32.3664 GCT 0.923999 5.279041 AGC 5.335471 1.052692 GGA 0.692521 2.109836 TCC 1.987649 0.778948 GGC 21.92536 12.23393 GCC 11.29651 21.6503 GGG 3.590778 4.887342 CCC 4.069038 3.055701 GGT 1.209042 4.771612 ACC 4.246951 0.863519 GTA 0.489738 5.977869 TAC 5.496166 0.496301 GTG 12.6892 5.866591 CAC 4.962428 11.54178 GTT 0.788173 7.077298 AAC 7.085903 0.674346 TAT 2.565388 0.140211 ATA 0.145391 2.341295 TCA 0.330956 0.725534 TGA 0.753738 0.409504 TCT 0.235304 0.211429 AGA 0.164522 0.220331 TTA 0.088 0.224782 TAA 0.185565 0.091248 64 PHỤ LỤC Mật độ trimer trình tự protein sense antisense R2 nhiễm sắc thể (NC_006348) vi khuẩn B mallei ATCC23344 Trimer BSĐN TTT R2-S_Trimer BSĐN 1.205137 R2-AS_Trimer BSĐN 1.238191 1.144011 CTT 1.082491 9.705161 0.247453 TGT 0.198634 0.370257 11.5048 2.154138 CGT 1.682393 11.22866 AGT 0.311949 0.280693 ACT 0.28662 0.37118 ATG 6.902877 2.563174 CAT 2.479597 7.362663 ATT 1.319785 1.601061 AAT 1.563746 1.701704 CAA 2.255633 2.204921 TTG 1.866363 1.699857 CAG 8.917216 14.80289 CTG 14.94557 8.772594 CCA 0.446594 4.214095 TGG 4.247309 0.264997 CCG 12.63261 5.409812 CGG 5.091172 12.60812 CCT 0.505251 0.54015 AGG 0.443928 0.421964 CGA 1.174476 8.724581 TCG 8.777239 1.01382 Trimer R2-S_Trimer R2-AS_Trimer AAA 1.502422 1.372074 AAG 8.917216 ACA 0.531913 ACG CTA 0.298618 0.09972 TAG 0.125313 0.192053 GAA 6.100341 10.67004 TTC 10.95955 5.919493 GAC 13.15519 11.80944 GTC 11.51546 12.90544 GAG 9.946382 14.2535 CTC 15.73077 11.38101 GAT 4.780556 12.98023 ATC 13.28851 5.602789 GCA 2.566249 2.995295 TGC 3.100829 2.284328 GCG 31.18826 17.10568 CGC 17.79311 32.46349 GCT 1.16781 4.769942 AGC 5.104503 1.121851 GGA 0.83853 1.935308 TCC 2.155649 0.824537 GGC 21.76313 11.06339 GCC 12.32999 21.81561 GGG 2.939522 3.792132 CCC 4.749894 3.713648 GGT 1.162478 4.141152 ACC 4.745895 1.460714 GTA 0.659893 5.421816 TAC 5.523102 0.568774 GTG 11.2555 5.119886 CAC 5.441781 12.80387 GTT 0.758543 6.64154 AAC 6.870882 1.026747 TAT 2.426272 0.159737 ATA 0.177304 2.472688 TCA 0.443928 0.76175 TGA 0.741213 0.31855 TCT 0.234629 0.175433 AGA 0.182637 0.242837 TTA 0.099984 0.212367 TAA 0.217298 0.087717 65 PHỤ LỤC Mật độ trimer trình tự protein sense antisense R1 nhiễm sắc thể (NC_006349) vi khuẩn B mallei ATCC23344 Trimer R1-S_Trimer R1-AS_Trimer Trimer BSĐN TTT R1-S_Trimer BSĐN 1.595367 R1-AS_Trimer BSĐN 1.639095 AAA 1.028386 1.639095 AAG 7.134185 6.763561 CTT 1.266909 6.763561 ACA 0.482911 0.702844 TGT 0.373425 0.702844 ACG 10.96619 11.08553 CGT 2.09783 11.08553 AGT 0.385156 0.403873 ACT 0.281535 0.403873 ATG 6.932809 6.501306 CAT 2.92875 6.501306 ATT 1.599277 1.463384 AAT 1.747866 1.463384 CAA 1.73027 2.50716 TTG 2.5651 2.50716 CAG 8.279877 7.521479 CTG 15.10516 7.521479 CCA 0.330413 0.708089 TGG 4.596456 0.708089 CCG 12.68082 12.85837 CGG 7.116589 12.85837 CCT 0.63541 0.658261 AGG 0.768357 0.658261 CGA 1.614918 2.087551 TCG 9.349321 2.087551 CTA 0.220927 0.451079 TAG 0.136857 0.451079 GAA 4.893632 6.076453 TTC 10.19197 6.076453 GAC 12.51855 13.30158 GTC 11.11283 13.30158 GAG 11.18712 8.74621 CTC 13.02297 8.74621 GAT 6.03346 5.163805 ATC 11.59965 5.163805 GCA 2.275744 3.307038 TGC 3.454674 3.307038 GCG 34.43725 30.89104 CGC 17.73868 30.89104 GCT 1.309922 1.266693 AGC 5.450838 1.266693 GGA 1.083129 1.185393 TCC 1.923825 1.185393 GGC 21.32826 20.45853 GCC 10.66902 20.45853 GGG 4.588636 2.90841 CCC 3.616948 2.90841 GGT 1.464375 1.1513 ACC 4.062712 1.1513 GTA 0.600218 0.639903 TAC 4.958151 0.639903 GTG 12.83723 10.24369 CAC 4.795877 10.24369 GTT 1.047937 0.957231 AAC 6.097978 0.957231 TAT 2.75279 2.664513 ATA 0.254164 2.664513 TCA 0.428168 0.681863 TGA 0.8231 0.681863 TCT 0.375381 0.372402 AGA 0.211152 0.372402 TTA 0.107531 0.178334 TAA 0.127082 0.178334 66 PHỤ LỤC Mật độ trimer trình tự protein sense antisense R2 nhiễm sắc thể (NC_006349) vi khuẩn B mallei ATCC23344 1.510651 Trimer BSĐN TTT R2-S_Trimer BSĐN 1.342558 R2-AS_Trimer BSĐN 0.887824 1.070114 CTT 1.020057 6.611417 0.745334 0.290315 TGT 0.250834 0.3899 ACG 10.99846 1.90055 CGT 1.935003 11.08767 AGT 0.298612 0.319009 ACT 0.403723 0.35783 ATG 6.335343 2.867704 CAT 2.964616 6.636735 ATT 1.361669 1.48702 AAT 1.643558 1.400938 CAA 2.305281 2.265132 TTG 1.696114 1.643993 CAG 7.620567 14.83644 CTG 14.84219 8.392128 CCA 0.594834 4.530264 TGG 4.31434 0.361206 CCG 13.14608 7.327077 CGG 6.538399 13.12662 CCT 0.788335 0.717348 AGG 0.683223 0.49286 CGA 2.276615 8.930561 TCG 8.82218 1.449887 CTA 0.315334 0.123215 TAG 0.124222 0.217736 GAA 5.492064 10.00068 TTC 10.09785 4.572461 GAC 12.55602 10.89019 GTC 11.44757 13.21439 GAG 8.590458 13.29541 CTC 14.93297 10.74165 GAT 5.031008 11.39993 ATC 11.99702 5.991966 GCA 3.191561 3.45171 TGC 3.659783 2.293826 GCG 32.31694 18.74895 CGC 19.73464 35.55008 Trimer R2-S_Trimer AAA 1.397502 AAG 6.380732 ACA R2-AS_Trimer GCT 1.545614 5.759039 AGC 5.757231 1.211896 GGA 1.039168 1.868481 TCC 2.379337 0.980657 GGC 21.10587 11.12143 GCC 13.49247 22.38126 GGG 2.967005 3.691388 CCC 4.916341 4.449246 GGT 0.962724 3.978328 ACC 4.684618 1.262532 GTA 0.594834 5.220606 TAC 5.406064 0.557 GTG 10.18863 4.930291 CAC 5.762009 12.36202 GTT 0.960335 6.361611 AAC 6.330565 0.967154 TAT 2.336337 0.212673 ATA 0.296223 2.84745 TCA 0.633057 0.7241 TGA 0.817001 0.388212 TCT 0.382223 0.210985 AGA 0.269945 0.24643 TTA 0.148111 0.106336 TAA 0.162445 0.109712 67 PHỤ LỤC Mật độ trimer trung bình R1 vi khuẩn B mallei ATCC23344 Trimer BSĐN TTT R1-S_Trimer BSĐN 1.502639 R1-AS_Trimer BSĐN 1.486104 3.885871 CTT 1.158584 7.712731 0.428204 TGT 0.297669 0.565076 11.46422 6.303907 CGT 1.890653 11.20349 AGT 0.352317 0.309876 ACT 0.263202 0.332132 ATG 6.993095 4.50921 CAT 2.699243 6.565633 ATT 1.487377 1.469467 AAT 1.713758 1.361527 CAA 1.718351 2.064798 TTG 2.346201 2.263987 CAG 8.878541 11.16965 CTG 14.73222 8.078336 CCA 0.287641 2.651941 TGG 4.350921 0.529864 CCG 12.56353 9.024195 CGG 6.296812 12.73644 CCT 0.537705 0.596198 AGG 0.672091 0.556138 CGA 1.303893 5.251207 TCG 9.267871 1.602393 Trimer R1-S_Trimer R1-AS_Trimer AAA 1.050801 1.378164 AAG 7.923086 ACA 0.413629 ACG CTA 0.208029 0.27784 TAG 0.119124 0.350171 GAA 4.969161 8.397388 TTC 10.37885 5.955943 GAC 12.79327 12.44839 GTC 11.34049 13.42653 GAG 11.10025 12.10917 CTC 13.83556 9.468537 GAT 5.834639 9.042719 ATC 12.02199 5.0801 GCA 2.141262 3.242573 TGC 3.288378 2.847535 GCG 34.3566 24.85076 CGC 17.69229 31.62872 GCT 1.11696 3.272867 AGC 5.393154 1.159693 GGA 0.887825 1.647615 TCC 1.955737 0.982171 GGC 21.62681 16.34623 GCC 10.98276 21.05441 GGG 4.089707 3.897876 CCC 3.842993 2.982056 GGT 1.336708 2.961456 ACC 4.154831 1.00741 GTA 0.544978 3.308886 TAC 5.227159 0.568102 GTG 12.76322 8.055139 CAC 4.879152 10.89274 GTT 0.918055 4.017265 AAC 6.591941 0.815789 TAT 2.659089 1.402362 ATA 0.199777 2.502904 TCA 0.379562 0.703699 TGA 0.788419 0.545684 TCT 0.305342 0.291916 AGA 0.187837 0.296367 TTA 0.097765 0.201558 TAA 0.156323 0.134791 68 PHỤ LỤC Mật độ trimer trung bình R2 vi khuẩn B mallei ATCC23344 Trimer BSĐN TTT R2-S_Trimer BSĐN 1.273847 R2-AS_Trimer BSĐN 1.063007 1.107062 CTT 1.051274 8.158289 0.268884 TGT 0.224734 0.380078 11.25163 2.027344 CGT 1.808698 11.15817 0.30528 0.299851 ACT 0.345171 0.364505 ATG 6.61911 2.715439 CAT 2.722106 6.999699 ATT 1.340727 1.54404 AAT 1.603652 1.551321 CAA 2.280457 2.235026 TTG 1.781238 1.671925 CAG 8.268892 14.81967 CTG 14.89388 8.582361 CCA 0.520714 4.372179 TGG 4.280825 0.313101 CCG 12.88934 6.368445 CGG 5.814785 12.86737 CCT 0.646793 0.628749 AGG 0.563576 0.457412 CGA 1.725545 8.827571 TCG 8.79971 1.231854 Trimer R2-S_Trimer R2-AS_Trimer AAA 1.449962 1.441362 AAG 7.648974 ACA 0.638624 ACG AGT CTA 0.306976 0.111468 TAG 0.124768 0.204895 GAA 5.796203 10.33536 TTC 10.5287 5.245977 GAC 12.85561 11.34981 GTC 11.48152 13.05992 GAG 9.26842 13.77446 CTC 15.33187 11.06133 GAT 4.905782 12.19008 ATC 12.64276 5.797377 GCA 2.878905 3.223502 TGC 3.380306 2.289077 GCG 31.7526 17.92731 CGC 18.76387 34.00679 GCT 1.356712 5.26449 AGC 5.430867 1.166873 GGA 0.938849 1.901894 TCC 2.267493 0.902597 GGC 21.4345 11.09241 GCC 12.91123 22.09843 GGG 2.953263 3.74176 CCC 4.833117 4.081447 GGT 1.062601 4.05974 ACC 4.715257 1.361623 GTA 0.627363 5.321211 TAC 5.464583 0.562887 GTG 10.72206 5.025088 CAC 5.601895 12.58294 GTT 0.859439 6.501575 AAC 6.600724 0.996951 TAT 2.381304 0.186205 ATA 0.236764 2.660069 TCA 0.538492 0.742925 TGA 0.779107 0.353381 TCT 0.308426 0.193209 AGA 0.226291 0.244633 TTA 0.124048 0.159352 TAA 0.189871 0.098714 69 PHỤ LỤC Mật độ phân bố trimer trình tự protein sense antisense nhiễm sắc thể nhiễm sắc thể vi khuẩn B pseudomallei 1026 PHỤ LỤC Mật độ phân bố trimer trình tự protein sense antisense nhiễm sắc thể nhiễm sắc thể vi khuẩn B mallei SAVP 70 PHỤ LỤC 10 Mật độ phân bố trimer trình tự protein sense antisense nhiễm sắc thể nhiễm sắc thể vi khuẩn B thailandensis E264 PHỤ LỤC 11 Mật độ phân bố trimer trình tự protein sense antisense nhiễm sắc thể nhiễm sắc thể vi khuẩn B phymatum STM815 71 LÝ LỊCH TRÍCH NGANG Họ tên: Phạm Tâm Tình Ngày, tháng, năm sinh: 23/01/1985 Nơi sinh: Đồng Nai Địa liên lạc: A10.414, chung cƣ Ehome 3, Hồ Học Lãm, P An Lạc, Q Bình Tân, TP HCM Q TRÌNH ĐÀO TẠO Từ 2005 đến 2010 : Sinh viên Khoa Công nghệ Sinh học – Chuyên ngành Công nghệ vi sinh - Trƣờng Đại học Mở Thành phố Hồ Chí Minh Từ 2016 đến nay: Học viên cao học Khoa Kỹ thuật Hóa học – Chun ngành Cơng nghệ Sinh học – Đại học Bách Khoa thành phố Hồ Chí Minh Q TRÌNH CƠNG TÁC Từ 10/2010 đến 12/2012: Cơng tác khoa Xét nghiệm – Bệnh viện Ung bƣớu Từ 12/2012 đến nay: Công tác khoa Ngân hàng Tế bào gốc – Bệnh viện Truyền máu Huyết học 72 ... định khoảng cách tiến hóa trình tự protein sense antisense hai vi khuẩn khác Khi vi khuẩn B tiến hóa xa vi khuẩn A, khoảng cách tiến hóa d trình tự protein sense antisense hai loài vi khuẩn đƣợc... antisense trình tự làm khn để tổng hợp nên trình tự mRNA, mức độ thay đổi trimer trình tự protein sense antisense vi khuẩn trình tiến hóa sở để tính tốn mức độ thay codon q trình tiến hóa vi khuẩn, ... 37 3.2 MỨC ĐỘ THAY ĐỔI MẬT ĐỘ TRIMER TRONG CÁC TRÌNH TỰ PROTEIN SENSE VÀ ANTISENSE TRONG QUÁ TRÌNH TIẾN HÓA 39 3.2.1 Mức độ thay đổi mật độ phân bố trimer q trình tiến hóa vi khuẩn

Ngày đăng: 03/03/2021, 20:54

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Watson JD, Crick FHC, 1953. A structure for deoxyribose nucleic acid. Nature 171: 737-738 Sách, tạp chí
Tiêu đề: Nature
2. Jukes TH, Cantor CR, 1969. Evolution of protein molecules, in Mammalian Protein Metabolism, ed HM Munro, NewYork, NY: Academic Press, 21-132 Sách, tạp chí
Tiêu đề: NY: Academic Press
3. Altschul SF, Gish W, Miller W, Myers EU; Lipman DJ, 1990. Basic local alignment search tool. J Mol Biol, 215: 403-410 Sách, tạp chí
Tiêu đề: Basic local alignment search tool. J Mol Biol
5. Dayhoff MO, Schwartz RM, Orcutt BC, 1978. A model of evolutionary change in proteins,” in Atlas of Protein Sequence and Structure, ed. MO Dayhoff (Washington DC: National Biomedical Research Foundation), pp. 345-352 Sách, tạp chí
Tiêu đề: MO Dayhoff (Washington DC: National Biomedical Research Foundation)
6. Henikoff S, Henikoff JG, 1992. Amino acid substitution matrices from protein blocks. Proc Natl Acad Sci USA, 89: 10915-10919 Sách, tạp chí
Tiêu đề: Proc Natl Acad Sci USA
7. Schneider A, Cannarozzi GM, Gonnet GH, 2005. Empirical codon substitution matrix. BMC Bioinformatics, 6: 134 Sách, tạp chí
Tiêu đề: BMC Bioinformatics
8. Muse SV, Gaut BS, 1994. A likelihood approach for comparing synonymous and nonsynonymous nucleotide substitution rates, with application to the chloroplast genome. Mol Biol Evol, 11: 715-724 Sách, tạp chí
Tiêu đề: Mol Biol Evol
9. Kimura, M. 1980. A simple method for estimating evolutionary rate of base substitutions through comparative studies of nucleotide sequences. J Mol Evol 16: 111-120 Sách, tạp chí
Tiêu đề: J Mol Evol
10. Collins DW, Jukes TH, 1994. Rates of transition and transversion in coding sequences since the human-rodent divergence. Genomics, 20: 386-396 Sách, tạp chí
Tiêu đề: Genomics
11. Felsenstein J, 1981. Evolutionary trees from DNA sequences: a maximum likelihood approach. J Mol Evol, 17: 368-376 Sách, tạp chí
Tiêu đề: J Mol Evol
12. Hasegawa M, Kishino H, Yano T, 1985. Dating the human-apes plitting by a molecular clock of mitochondrial DNA. J Mol Evol, 22: 160-174 Sách, tạp chí
Tiêu đề: J Mol Evol
13. Zharkikh A, 1994. Estimation of evolutionary distances between nucleotide sequences. J Mol Evol, 39: 315-329 Sách, tạp chí
Tiêu đề: J Mol Evol
14. Tavaré S, 1986. Some probabilistic and statistical problems in the analysis of DNA sequences, in Some Mathematical Questions in Biology-DNA Sequence Analysis, ed RM Miura (Providence, RI:Amer Math Soc), 57-86 Sách, tạp chí
Tiêu đề: ed RM Miura (Providence, RI:Amer Math Soc
15. Shoemaker JS, Fitch WM, 1989. Evidence from nuclear sequences that invariable sites should be considered when sequence divergence is calculated.Mol Biol Evol, 6: 270-289 Sách, tạp chí
Tiêu đề: Mol Biol Evol
16. Yang Z, 1994. Maximum likelihood phylogenetic estimation from DNA sequences with variable rates over sites: approximate methods. J Mol Evol, 39:306-314 Sách, tạp chí
Tiêu đề: J Mol Evol
17. Sumner JG, Jarvis PD, Fernández-Sánchez J, Kaine BT, Woodhams MD, Holland BR, 2012. Is the general time-reversible model bad for molecular phylogenetics? Syst Biol, 61: 1069-1074 Sách, tạp chí
Tiêu đề: Syst Biol
18. Arenas M, 2015. Trends in substitution models of molecular evolution. Front Genet, 6: 319 Sách, tạp chí
Tiêu đề: Front Genet
19. Mueller T, Spang R, Vingron M, 2002. Estimating amino acid substitution models: a comparison of Dayhoff's estimator, the resolvent approach and a maximum likelihood method. Mol Biol Evol, 19: 8-13 Sách, tạp chí
Tiêu đề: Mol Biol Evol
20. Halpern, AL, Bruno WJ, 1998. Evolutionary distances for protein-coding sequences: modeling site-specific residue frequencies. Mol Biol Evol, 15: 910- 917 Sách, tạp chí
Tiêu đề: Mol Biol Evol
21. Lartillot N, Philippe H, 2004. A Bayesian mixture model for across-site heterogeneities in the amino-acid replacement process. Mol Biol Evol, 21:1095-1109 Sách, tạp chí
Tiêu đề: Mol Biol Evol

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w