Kết quả khảo sát cho thấy rang mật độ phân bố của một trimerbất kỳ, tức số lần xuất hiện trung bình của trimer đó trong 1 kbp, trong nhóm các trìnhtự sense hoặc antisense trên một replic
Trang 1ĐẠI HỌC QUOC GIA TP HCMTRƯỜNG ĐẠI HỌC BÁCH KHOA
a
TRAN THI HUONG THAO
NGHIEN CUU SU PHAN BO CUA CAC TRIMER TRONG
CAC TRINH TU SENSE VA ANTISENSE CUA CACNHIEM SAC THE VI KHUAN BURKHOLDERIA LATA
Chuyên ngành: Công nghệ Sinh họcMã số: 60 42 02 01
LUẬN VĂN THẠC SĨ
TP HO CHI MINH, tháng 7 năm 2018
Trang 2CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI
TRƯỜNG ĐẠI HOC BACH KHOA —DHQG —HCM
Cán bộ hướng dẫn khoa hoc: TS Phan Thị Huyền(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 1: PGS.TS Nguyễn Đức Lượng(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 2: TS Trần Trung Hiểu(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Luận văn thạc sĩ được bảo vệ tại Trường Dai học Bách Khoa, DHQG Tp HCMngày 21 tháng 07 năm 2018
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:(Ghi rõ ho, tên, học hàm, học vi của Hội đông cham bảo vệ luận văn thạc si)
1 Chủ tịch: PGS.TS Nguyễn Thúy Huong2 Thư ký: TS Hoàng Mỹ Dung
3 Phản biện 1: PGS.TS Nguyễn Đức Lượng
4 Phản biện 2: TS Trần Trung Hiếu5 Uy viên: TS Huỳnh Ngọc OanhXác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngànhsau khi luận văn đã được sửa chữa (nêu có).
CHỦ TỊCH HỘI ĐÔNG TRƯỞNG KHOA
PGS.TS Nguyễn Thúy Hương GS.TS Phan Thanh Sơn Nam
Trang 3ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAMTRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự do - Hạnh phúc
NHIEM VỤ LUẬN VAN THẠC SĨ
Họ tên học viên: Trần Thị Hương Thảo MSHV: 1670262Ngày, thang, năm sinh: 09/12/1993 Noi sinh: Kién Giang
Chuyén nganh: Cong nghé Sinh hoc Mã số : 60 42 02 01
TEN DE TÀI: Nghiên cứu sự phân bố của các trimer trong các trình tự sense vàantisense của các nhiêm sac thê vi khuan Burkholderia lata.
NHIEM VU VA NOI DUNG: Khảo sát sự phân bố của các trimer trong các trình tựsense va antisense của các nhiễm sac thê khác nhau của vi khuân Burkholderia lata383.
NGÀY GIAO NHIEM VU :(Ghi theo trong QD giao dé tai) 10/07/2017.NGÀY HOÀN THÀNH NHIEM VỤ:(Ghi theo trong QD giao dé tai) 03/12/2017.CÁN BO HUONG DAN (Ghi rõ học hàm, học vi, ho, tên): TS Phan Thị Huyén
Tp HCM, ngày 13 tháng O07 năm 2018CÁN BỘ HƯỚNG DÂN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO
Trang 4LỜI CÁM ƠNDé hoàn thành dé tài luận văn thạc sĩ này, em xin được gửi những lời cảm ơnsu sac nhút tới:
Cô Phan Thị Huyễn, người Cô đáng kính với những chi dẫn khoa học quý bau,đã luôn theo sát và đầu dắt em hoàn thành dé tài luận văn thạc sĩ này
Thay Phan Thanh Sơn Nam, cô Nguyễn Thúy Hương và các thay cô Phòng Đàotạo Sau Đại học đã tạo điều kiện vật chất lẫn tinh thần tốt nhất dé em hoàn thành luậnvan cua minh.
Em xin cảm on tat ca Thay, Cô trong Khoa Kỹ thuật Hóa học — Công nghệ sinhhọc đã truyén dat cho em những kiến thức khoa học trong suốt hai năm em ngôi trênghế giảng đường
Cam ơn chị Ngân, anh Minh, chị Hán, chị Vi cùng tat cả anh chị lớp Cao họcKhóa 2016 đã luôn quan tâm, giúp đỡ và cho em thật nhiều niém vui và những ki niệmđáng quý trong suốt thời gian chúng ta học tập dưới mái trường Dai học Bách Khoathành phô Hô Chí Minh
Cảm ơn An, Đăng, Kha và Nguyên Khoa đã luôn sát cánh bên mình trong bấtcứ hoàn cảnh nào Thật may man khi cuộc đời này có các bạn bên cạnh mình.
Và trên hết, con cam ơn Mẹ, anh Hai và gia đình luôn tạo điêu kiện tot nhát dé
con được học tap, luôn bên cạnh, động viên và cô vit con Moi người mãi là niêm yêu
thương vô bo bên cua con.
Cẩmu chúc cho mọi điêu tot đẹp nhất luôn đên với mọi người Hy vọng ở đoạn
đường sap tới, sẽ luôn có mọi người bên cạnh Xin chán thành cam ơn tat ca!
Trần Thị Hương Thảo
Trang 5TOM TAT LUẬN VĂNĐa số vi khuẩn có một nhiễm sắc thé (NST) là sợi đôi DNA hình vòng tròn khép kín,có một điểm khởi đầu sao chép và một điểm kết thúc sao chép, tạo thành hai replichorecó chiều dài gần bằng nhau NST vi khuẩn chứa các đoạn trình tự mang thông tin mãhóa protein, rRNA, tRNA và các trình tự không mã hóa Trong sợi đơn của các đoạn
trình tự nay, thành phan các nucleotide không giống nhau, tức là các đoạn trình tự nàykhông đối xứng Tuy nhiên, trong toàn bộ sợi đơn cua NST hoàn chỉnh, số lượngadenine (A) và số lượng thymine (T) là gần như nhau, đồng thời số lượng cytosine (C)và số lượng guanine (G) cũng gần như nhau, tức là nhiễm sắc thể đối xứng Khôngnhững thế, các oligomer kích thước ngăn va các oligomer bố sung đảo ngược (BSDN)tương ứng, ví dụ GAT và ATC, cũng có số lượng gần như nhau Các vi khuẩn khácnhau có các NST có kích thước khác nhau và trình tự nucleotide khác nhau, tuy nhiên
đều giống nhau ở đặc điểm đối xứng Đặc điểm này có liên quan mật thiết với tốc độsao chép và sự phân bố của nucleoid trong tế bào, do đó việc can thiệp làm mat đi tínhđối xứng của NST làm ảnh hưởng nghiêm trọng đến các quá trình tổng hợp DNA vàphân chia tế bào Vì thế, vấn dé các nucleotide phân bố như thế nào trong các NSTkhác nhau sao cho các NST đều trở nên đối xứng cần được quan tâm tìm hiểu Đề tàinày khảo sát sự phân bố của các trimer trong các trình tự protein sense va antisense,tức các trình tự mang thông tin mã hóa protein, của các NST khác nhau của vi khuẩnBurkholderia lata 383 Kết quả khảo sát cho thấy rang mật độ phân bố của một trimerbất kỳ, tức số lần xuất hiện trung bình của trimer đó trong 1 kbp, trong nhóm các trìnhtự sense (hoặc antisense) trên một replichore của NST gan bang mật độ phân bố củatrimer BSDN tương ứng trong nhóm các trình tự antisense (hoặc sense) trên replichore
còn lại Mat độ phan bố của các trimer trong các nhóm trình tự sense hoặc antisensetrên hai replichore của cả 3 NST của vi khuẩn này là như nhau Tan suất xuất hiện củacác khoảng cách giữa các trimer cùng loại liền kề trong các trình tự sense (hoặcantisense) trên một replichore thì tương đồng với tần suất xuất hiện của các khoảngcách giữa các trimer BSDN tương ứng trong các trình tự antisense (hoặc sense) trên
replichore còn lại Mặc dù ba NST khác nhau về kích thước và trình tự, các kiểu phânbó của trimer/trimer BSDN nay giống nhau ở cả ba NST
Trang 6Most bacteria have only one circular chromosome, which is a double-stranded DNA
molecule, possessing an origin and a terminus of replication, forming two replichores
which are nearly equal in length The bacterial chromosome contains DNA segments
which carry information for encoding proteins, rRNA, tRNA and those that are
non-encoding In these local single-stranded chromosomal segments, the nucleotide
composition is skewed, i.e these segments are asymmetric Nevertheless, in the whole
single-stranded chromosome, the numbers of adenine (A) and thymine (T) are similar,
as are those of cytosines and guanines, i.e the whole chromosome is symmetric Also,
short oligomers and their respective reverse complements, such as GAT and ATC,
have similar frequencies Different bacteria have their chromosomes of different sizes
and different nucleotide sequences, however, they all have the same symmetric
property This property has a close relationship with the replication rate and the
distribution of nucleoid in the cell, thus interfering to cause this property lost from the
chromosome seriously affects the processes of DNA synthesis and cell division.
Therefore, how the nucleotides asymmetrically distribute in different bacterial
chromosomes to make these whole chromosomes symmetric needs to be uncovered.
This research investigates the distribution of trimers in the protein sense and antisense
sequences, i.e sequences that carry information for encoding proteins, of the
Burkholderia lata 383 The investigation results show that densities of trimers, i.e the
average trimer frequencies per | kbp, in the sense (or antisense) sequences on the one
replichore and those of their respective reverse complements in the antisense (or sense)
sequences on the other replichore are almost equal The trimer densities in the sense or
antisense sequences on the two replichores of all the three different chromosomes of
this bacterium are similar On the distribution of the trimer and their respective reverse
complements in the sense and antisense sequences on the replichores of each of the
three B lata chromosomes, we found that the frequencies of distance between the
adjacent trimers in the sense (or antisense) sequences on the one replichore were
almost similar to those between the adjacent respective reverse complements in the
antisense (or sense) sequences on the other replichore Although the three
chromosomes were different in size and nucleotide sequence, these patterns of the
Trang 7distribution of the trimer/trimer reverse complement were observed to be similar in all
these three chromosomes.
Trang 8LỜI CAM ĐOAN
Tôi tên Trần Thị Hương Thảo, học viên cao học ngành Công nghệ Sinh học, Khóa2016 đợt 1, Khoa Kỹ thuật Hóa học, Trường đại học Bách khoa Thành phố Hồ ChiMinh, xin cam đoan công trình nghiên cứu này do chính tôi thực hiện, số liệu là kết
quả nghiên cứu thực sự của tôi dưới sự hướng dẫn khoa học của TS Phan Thị Huyền
Tôi xin chịu hoàn toàn trách nhiệm vê kêt quả nghiên cứu trong luận văn tot nghiệp
của mình.
Tp Hô Chi Minh, ngày 13 tháng 07 năm 2018
Học viên thực hiện
Trần Thị Hương Thảo
Trang 9MỤC LỤCNHIỆM VỤ LUẬN VĂN THAC SÌ G- G- s13 23 E13 2v ng n ccrved ii
CAN BO HUONG DAN 1 iiCHU NHIỆM BO MON ĐÀO TAO Q ccescssesscscecessesscscececeesevscscesseavacacececssssceceaveves iiTRUONG KHOA 025 iiLOI CAM ON uiceeccccccccscscsscscscscscscscscscsscscscscscsssscscsvscsssscsescsvsssscscsssssssecsessavsssssseseseans iiiTOM TAT LUẬN VAN ueeccecccscssscscecscscscececececececscsesevsvavevavevscaracacacacacacacececececeseasasass ivSUMMARY ovecccccccscccsssscscsssscscsssesscscscscsssscscscsvsssscsescsvsssscsesssssssscsesssssesscsessssessseseaeensess V
DANH MỤC HÌNH - - tt S15191 1 1 5 96111 11 91010151111 1111012110 gu ng X
DANH MỤC HÌNH PHU uu eccccccscscececececsccecscecececcevecscececsevevscaceceeevavacececsevavacaceceseeves xiiDANH MỤC BANG PHỤU - -G- s11 1919191 3E 911191 1E 1111158 1E ng ree xiiiCAC TỪ VIET TAT ceececcccccccccccscscsscscscscscscscscscssssescssscsscscscscsssssesesvsssssscseessssssscseecans xivMO DAU cocecececs cccccscsssscscscscsscscscscsssscscscsvsssscscscsvsesscscsvscsssscscsvsssessesesssssssscscsssessessseseeteess 15CHUONG 1 TONG QUAN LY THUYET u ccccccscsccecessssssscscecescesecscscecessevevsceceees 171.1 NHIÊM SAC THE VI KHUAN ooeeeccccccccccccsescsescscssssesescscsssseseseessssseseseseens 171.2 TINH HÌNH NGHIÊN CUU TRONG VA NGOÀI NƯỚC 181.3 TÍNH CAP THIET CUA DE TAL ooeecccccccccccccscscssescscsssscsescscssssesessessssseseseeeens 2014 LUẬN DIEM MỚI CUA DE TAL ccecescecececececescesececscsecesecscececeevevscsceceevevees 201.5 MỤC TIỂU NGHIÊN CỨU - - - ksEsEE9ESE SE E$E#E£E SE EEsererxes 211.6 YNGHIA KHOA HOC VÀ THUC TIEN CUA DE TÀI -5-5s: 211.6.1 Y nghĩa khoa hoc vecececccscscsccssscsssescscscsssscscscscsscscscsssssscscscsssssscscscscssssssessessseees 211.6.2 Y nghĩa thực tiỄn + + Sex 3 111515151515 5 111111011101 1111 11111 1e 22CHUONG 2 VAT LIEU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 23
Trang 10CHƯƠNG 3 KẾT QUÁ NGHIÊN CỨU VÀ BAN LUẬN - 5-5: 263.1 Số lượng các trimer trong các trình tự sense và antisense của NST 263.2 Vị trí khởi đầu và kết thúc sao chép trong NST -2-scc+czcscse: 293.3 Số lượng trimer trong các nhóm trình tự sense và antisense trên các replichore
Trang 11DANH MỤC HÌNH
Hình 3.1 Số lượng trimer trong tổng số các trình tự sense va antisense của NST 25Hình 3.2 Số lượng trimer trong nhóm các trình tự sense và trong nhóm các trình tựantisense của NS T” TT nh 26Hình 3.3 Các vị trí khởi đầu và kết thúc sao chép của NSTT 5-c-sccc<c: 28Hình 3.4 Số lượng trimer trong nhóm các trình tự sense va trong nhóm các antisense
trên mỗi replichore của NST E222 v13 3 3117151715111 11 11111111 xe 30
Hình 3.5 Mật độ phân bồ của trimer trong nhóm các trình tự sense va trong nhóm cáctrình tự antisense trên mỗi replichore của INST -¿ + 2 + + +c+E+x+E+Eetrxrsrsrseerereee 32Hình 3.6 Sự phân bố của GCG va CGC trong các trình tự sense và antisense trên các1300190101521 35
Trang 12DANH MỤC BANG
Bang 2.1 Kích thước và hàm lượng GC của các NŠSÏÏ' sàn 21Bang 2.2 Số lượng va thành phan nucleotide của cdc NST 2 2s scscscee: 21Bang 2.3 Số lượng và thành phần nucleotide của các trình tự sense and antisensetrong CAC NST P.34 21Bang 3.1 Cac trimer và các trimer BSDN tuong Ứng co HH 24Bang 3.2 9 vị trí đầu tiên và các khoảng cách tương ứng giữa các GCG trong R1_Svà giữa các CGC trong R2 AS của NST I GĂĂ SH vreu 33Bang 3.3 Khoảng cách giữa các GCG có (hoặc không có) trong R1_S nhưng khôngcó (hoặc có) giữa các CGC trong R2 AS của NST Ì cĂ Series 36Bảng 3.4 Hai mươi giá trị tần suất xuất hiện cao nhất của các khoảng cách D giữa cácGCG trong RI_S và giữa các CGC trong R2_AS của NST'I <<5 37
Trang 13DANH MỤC HÌNH PHỤ
Hình phụ 1 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm cáctrình tự antisense trên các replichore của các NST vi khuân giàu hàm lượng AT 34Hình phụ 2 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm cáctrình tự antisense trên các replichore của các NST vi khuẩn có hàm lượng GC trungHình phụ 3 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm cáctrình tự antisense trên các replichore của các NST vi khuẩn có hàm lượng GC cao 36
Trang 14DANH MỤC BANG PHU
Bảng phụ 1 Số lượng trimer trong tổng số các trình tự sense va antisense của NST 1¬— 43Bảng phụ 2 Số lượng trimer trong tong số các trình tự sense và antisense của NST 2¬— 4Bang phụ 3 Số lượng trimer trong tổng số các trình tự sense va antisense của NST 3¬— 45Bảng phụ 4 Số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST l ¿5255552222 SE 2+2 EEzEeEeterrererereee 46
Bảng phụ 5 Số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST 2 ¿- +22 2E 2e 2E 2E E3 2E E2 EEErkrkrkreee 47
Bảng phụ 6 Số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST 3 - -¿- 6+6 2xx SE SE EEErrrkrerrreee 46
Bảng phụ 7 Mật độ phân bồ của trimer trong nhóm các trình tự sense và trong nhómcác trình tự antisense trên mỗi replichore của NST 1 - ¿5555 s<s<scscscs2 49Bảng phụ 8 Mật độ phân bố của trimer trong nhóm các trình tự sense và trong nhómcác trình tự antisense trên mỗi replichore của NST 2 - +55 55s cscscsccscee 50Bảng phụ 9 Mật độ phân bố của trimer trong nhóm các trình tự sense và trong nhómcác trình tự antisense trên mỗi replichore của NST 3 - ¿55555 cscscscscsce2 51Bang phụ 10 Cac NST của các vi khuẩn có các ham lượng GC khác nhau 52
Trang 15kbp Kilo base pair
rRNA ribosomal RNA
mRNA RNA thong tin
tRNA RNA van chuyénNCBI National Center for Biotechnology Information
Trang 16MỞ ĐẦU
Trong công nghệ gene, việc tạo ra được những chung, loài vi sinh vật với bộ
gene cho những san phẩm trao đôi chất mong muốn là thực sự cần thiết Tuy nhiên, sựthành công trong việc này lại phụ thuộc vào những hiểu biết của con người về cáctrình tự bộ gene và những quá trình sinh học liên quan đến trật tự sắp xếp của cácnucleotide trong phân tử DNA nhiễm sắc thé Các mối liên hệ giữa cấu trúc bộ gene vàcác quá trình sinh học xảy ra trong tế bảo có thé được xác định thông qua việc thay đổihoặc xóa bỏ các trình tự nucleotide trong bộ gene Tuy nhiên, các kỹ thuật trong sinh
học phân tử hiện nay chưa đủ để việc thay đôi hoặc xóa bỏ các trình tự nucleotidetrong bộ gene luôn được thành công Trong những năm gần đây, sự phát trién của tinhọc trong sinh học đã cung cấp nguồn thông tin quí giá hỗ trợ cho các kỹ thuật trongsinh học phân tử, đặc biệt là việc tìm hiểu cau trúc bộ gene và các quá trình sinh họcxảy ra trong tế bào sinh vật Các nghiên cứu mới đây đã tiết lộ mối liên hệ giữa sự sắpxếp của các nucleotide trong bộ gene đến các quá trình sinh học xảy ra trong tế bảo.Mặc dù các sinh vật khác nhau có các bộ gene với các trình tự nucleotide khác nhau
nhưng các phân tử DNA nhiễm sắc thể của chúng đều có chung một đặc điểm, đó làtính đối xứng Tuy vậy, các nueleotide được sắp xếp như thế nào để các phân tử DNAnhiễm sac thé trở nên đối xứng thì chưa được biết đến Do đó, việc xác định được quitac sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thé sé là co sở để địnhhướng cho việc tạo ra những vi sinh vật mong muốn
Nghiên cứu gần đây trên NST vi khuẩn Bacillus cereus ATCC 10987 cho thay sốlần xuất hiện của các trimer và của các trimer BSDN tương ứng trong toàn bộ các trìnhtự sense va antisense trong mỗi NST là tương đương nhau Bên cạnh đó, các trimertrong các trình tự sense của một replichore và các trimer BSDN tương ứng của chúng
trong các trình tự antisense của replichore còn lại cũng được tìm thấy là phân bố vớimật độ tương đương nhau Tuy nhiên, sự phân bố này có mang tính quy luật ở các vikhuẩn khác hay không vẫn chưa được làm rõ Tế bào vi khuẩn Burkholderia lata 383
15
Trang 17có ba NST hình vòng tròn khép kín, có trình tự và kích thước hoàn toàn khác nhau.
Giống như ở vi khuẩn B cereus ATCC 10987, số lần xuất hiện của các trimer và của
các trimer BSĐN tương ứng trong toàn bộ các trình tự sense và antisense của mỗi NST
cũng tương đương nhau Đề tài này khảo sát sự phân bố của các trimer trong các trìnhtự sense va antisense của các NST khác nhau của vi khuẩn B lata 383 nham tìm hiểuxem liệu mật độ phan bố của các trimer và các trimer BSĐN tương ứng ở các NSTkhác nhau của vi khuẩn nay có như nhau hay không, và có giống như ở vi khuẩn B.cereus ATCC hay không Nếu sự phân bố của các trimer trong các trình tự sense vàantisense của các NST vi khuẩn mang tính qui luật, việc tạo thành công các chủng vikhuẩn cho sản phẩm trao đôi chất mong muốn là hoàn toàn có thé nhờ công đoạn thiếtkê bộ gene in silico.
16
Trang 18CHƯƠNG 1 TONG QUAN LÝ THUYET
1.1 NHIEM SAC THE VI KHUANNhiễm sắc thé (NST) tế bào vi khuẩn da số là một sợi đôi DNA có hình vòng
tròn, hình thành từ hai sợi đơn DNA khép kín Mỗi sợi đơn DNA là một
polynucleotide được cầu tạo bởi các mắt xích nucleotide adenine (A), cytosine (C),thymine (T) va guanine (G) Cac nucleotide này được nối với nhau thông qua các liênkết phosphodiester, trong đó một nhóm phosphate được nối với hai nhóm đường(deoxyribose) của hai nucleotide Ở một đầu của polynucleotide có nhóm phosphategan vào nguyên tử carbon số 5 và dau kia có nhóm hydroxyl gan vào nguyên tử carbonsố 3 của đường deoxyribose Các đầu nay lần lượt được gọi là đầu 5’ và dau 3’ Haisợi đơn polynueleotide của nhiễm sắc thể kết hợp với nhau nhờ các liên kết hydrogentheo mô hình kết cặp nucleotide của Watson va Crick [1] Mỗi sợi đơn hoàn chỉnh củanhiễm sắc thể chứa các trình tự mang thông tin mã hóa cho protein, các RNA ribosome(rRNA), các RNA vận chuyển (tRNA) và các trình tự không ma hóa
Ở hau hết các vi khuẩn, phân tử DNA nhiễm sac thé chỉ có một điểm khởi dau vàmột điểm kết thúc sao chép DNA Rất nhiều nghiên cứu trước đây đã sử dụngnucleotide skew dé nhận biết vị trí điểm khởi đầu sao chép ở một số nhiễm sắc thể vikhuẩn, nhưng sự phân bố của các oligomer trong phân tử DNA nhiễm sắc thể thìkhông được công bố nhiều Khi kích thước oligomer càng lớn, nghiên cứu sẽ cảng trởnên phức tap vì số lượng oligomer tăng lên Có lẽ vì thé mà chỉ có sự phân bố của vàioligomer trong phân tử DNA nhiễm sắc thể đã được nghiên cứu mà thôi Như đã biết,ở mỗi phía của điểm khởi đầu sao chép, hai sợi DNA b6 sung tương ứng được sử dụnglàm khuôn để sao chép mạch trước (leading strand) và mạch sau (lagging trand) bởihai cau trúc khác nhau của bộ máy sao chép Cac nucleotide cũng như một số cácoligomer được tìm thấy là phân bố không cân đối ở hai phía của điểm khởi đầu saochép của các phân tử DNA nhiễm sac thé
17
Trang 1912 TINH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚCỞ các NST vi khuẩn, các đoạn trình tự cục bộ (tức các đoạn mang thông tin mãhóa cho protein, các rRNA, các tRNA và các trình tự không mã hóa) mang tính bat đốixứng (asymmetric), tức là thành phan các nucleotide trong soi đơn của các đoạn nàykhông giống nhau [2, 3, 4] Tính bất đối xứng của các đoạn nảy có liên quan đến quátrình sao chép và phiên mã DNA trong tế bao [5, 6] Mặt khác, các nucleotide trongcác đoạn năm rất xa nhau trong NST có mối liên hệ với nhau [7, 8, 9] Tuy nhiên, trìnhtự hoàn chỉnh của NST thì đối xứng (symmetric) [10, 11], tức là số lượng A gần bằngsố lượng T, và số lượng C gan bang số lượng G; đồng thời, số lượng mỗioligonucleotide (hay oligomer, tức dimer, trimer, tetramer, ) trong sợi đơn nhiễmsắc thé hoàn chỉnh tinh theo chiều 5’ — 3” và trong sợi bố sung cũng theo chiều 5’ >3’ cũng gần bang nhau Điều nay cũng có nghĩa là số lượng mỗi oligomer, vi dụ nhưATC, trong một sợi đơn hoàn chỉnh cua NST theo chiều 5° — 3” gân bằng với sốlượng của oligomer bồ sung đảo ngược (BSĐN) tương ứng của nó, chăng hạn GAT làtrimer BSĐÐN của ATC, trong sợi đơn hoàn chỉnh này theo chiều 5° — 3° Tính đốixứng này được cho là do đảo đoạn NST tạo ra [12, 13], làm hình thành nên kiểu phânbố mang tính phố biến của các trimer trong các nhiễm sắc thé [14] Tuy nhiên, cáctrimer được phân bố như thé nao dé các NST trở đối xứng thì chưa được biết đến Trênthực tế, sự phân bố của các nucleotide trong nhiễm sắc thé có ý nghĩa rất quan trọngđối với ngành công nghệ biến đổi DNA Phá vỡ sự phân bố tự nhiên của cácnucleotide trong NST bang cách đảo đoạn bên trong mỗi replichore có thé làm phá vỡsự phân bố của nucleoid trong tế bào, làm chậm tốc độ phân chia tế bào [15 16] Tuynhiên, đảo đoạn xảy ra quanh vùng tiếp giáp của hai replichore của vi khuẩn với cácđiểm cuối của đoạn DNA bị đảo có khoảng cách như nhau đối với điểm khởi đầu saochép lại là một hiện tượng phổ biến trong tự nhiên [17, 18] Như vậy, đảo đoạn [12]chỉ có thé là cơ chế nhăm duy trì đặc tính đối xứng vốn có của các phân tử DNA NSTchứ không phải dé tạo ra đặc tính nay Trong khi đó, các nghiên cứu in vivo khác lạitiết lộ rằng sự đối xứng của DNA NST qua trục nối điểm khởi đầu và điểm kết thúcsao chép có liên quan đến tốc độ sao chép và sự ôn định của NST [19, 20, 21] Thay
18
Trang 20đối vị trí điểm khởi đầu sao chép ở vi khuẩn bang cách đảo đoạn ving DNA chứađiểm nay làm giảm tốc độ sao chép DNA của tế bào [19, 20] Chèn toàn bộ phân tửDNA NST của một vi khuẩn vào một điểm trên NST của một vi khuẩn khác là điềukhông thể Itaya và cộng sự đã thất bại khi đưa phân tử DNA NST vi khuẩnSynechocystis sp PCC6803 vào NST vi khuẩn B subtilis bang cách chèn toàn bộDNA NST của Synechocystis vào một điểm trên phân tử DNA NST của Bacillus Thínghiệm chỉ thành công khi phân tử DNA NST tạo thành đối xứng qua các điểm khởiđầu và kết thúc sao chép của phân tử DNA NST vi khuẩn B subtilis [21] Mặt khác,việc tạo NST vi khuẩn nhân tạo chỉ thành công khi vi tri tương đối của các đoạnnucleotide tổng hợp mã hóa cho các RNA thông tin (mRNA) trong NST nhân tạo đượcduy trì như trong NST vi khuẩn tự nhiên [22] Tốc độ sao chép và tinh 6n định củaNST vì thé là những yếu tố cần được duy trì sau khi trình tự DNA NST bị thay đổi.
Trên NST vi khuẩn Bacillus cereus ATCC 10987, các trình tự profein sense vàantisense chiếm 83,3% [23] Trinh tự sense va antisense là các trình tự nucleotidemang thông tin mã hóa cho các mRNA Trinh tự sense có các nucleotide năm theo thứtự y hệt như trong trình tự mRNA, còn trình tự antisense là trình tự bé sung cua trinhtu mRNA Số lần xuất hiện của các trimer và của các trimer BSDN tương ứng trongtoàn bộ các trình tự sense va antisense trong mỗi NST là tương đương nhau [23] Cactrimer trong các trình tự sense của một replichore và các trimer BSDN tương ứng của
chúng trong các trình tự antisense của replichore còn lại cũng được tìm thay là phân bốvới mật độ tương đương nhau, với mật độ phân bố của một trimer bất kỳ trong cáctrình tự sense và antisense được định nghĩa là số lần xuất hiện trung bình của trimer đótrên mỗi kilobase pair các trình tự này [23]
Liệu sự phân bố của các trimer và các trimer BSDN tương ứng ở vi khuẩn B.cereus có mang tính qui luật, tức cũng được tìm thấy ở các NST vi khuẩn khác? Tếbào vi khuẩn Burkholderia lata 383 có ba NST hình vòng tròn khép kín, có trình tự vàkích thước hoàn toàn khác nhau Giống như ở vi khuẩn B cereus ATCC 10987 [23].số lần xuất hiện của các trimer và của các trimer BSĐN tương ứng trong toàn bộ cáctrình tự sense va antisense của mỗi NST cũng tương đương nhau [24] Dé tài này khảo
19
Trang 21sát sự phân bô của các trimer trong các trình tự sense va antisense của các NST khác
nhau của vi khuân B lata 383 nhăm tìm hiéu xem liệu mật độ phân bô của các trimer
và các trimer BSDN tương ứng ở các NST khác nhau của vi khuân này có như nhau
hay không, và có giống như ở vi khuẩn B cereus ATCC [23] hay không.1.3 TINH CAP THIẾT CUA DE TÀI
Theo nhu trinh bay trong Muc 1.2 thi cong viéc biến đối DNA can được địnhhướng và thiết kế kỹ càng trước khi được thực hiện dé đạt hiệu quả biến đổi cao Cũngtheo như trình bày trong Mục 1.2, nếu tất cả các NST vi khuẩn đều có chung đặc tínhđối xứng [10, 11] và sự phân bố của các nucleotide trong NST có mối quan hệ mậtthiết với tốc độ sao chép, sự phan bố nucleoid và tốc độ phân chia tế bào [15, 16, 19,20] thì các trimer phân bố như thế nào trong các trình tự sense và antisense để gópphân tạo nên tính đối xứng, trong khi các trình tự NST hoàn toàn khác nhau, là mộtvan dé đáng được tìm hiểu Tìm ra được qui luật phân bố của các nucleotide trongnhiễm sắc thể nhằm giúp việc thực hiện thay đổi các trình tự DNA trong NST theohướng điều tiết các quá trình sinh học của tế bao theo ý muốn là điều có ý nghĩa thựctiễn quan trọng
Đề tài này khảo sát sự phân bố của các trimer trong các trình tự sense vàantisense của các NST vi khuẩn B lata 383, nhằm tìm hiểu xem liệu phân bố trimertrong các trình tự sense va antisense của các NST khác nhau của vi khuẩn này có nhưđã tìm thay ở NST vi khuẩn B cereus ATCC 10987 [23] Nếu sự phân bố của cáctrimer trong các trình tự sense va antisense của các NST vi khuẩn mang tính qui luật,việc tạo thành công các chủng vi khuẩn cho sản phẩm trao đôi chất mong muốn làhoàn toàn có thê nhờ công đoạn thiệt kê bộ gene in silico.
1.4 LUẬN DIEM MỚI CUA DE TÀISu phan bố của các trimer trong các trình tự sense và antisense chỉ mới đượcnghiên cứu khá kỹ trên NST vi khuẩn B cereus ATCC 10987 [23] Sự phân bố của cáctrimer trong các trình tự sense và antisense của các NST B lata chỉ mới được nghiên
20
Trang 22cứu ở bước dau [24], cho thay cũng như ở vi khuẩn B cereus, số lần xuất hiện của cáctrimer và các trimer BSDN tương ứng trong toàn bộ các trình tự sense va antisense của
mỗi NST là tương đương Đề tài này khảo sát sự phân bố của các trimer trong các trìnhtự sense va antisense của các replichore của từng NST của vi khuẩn B lata 383
Kết quả của luận văn này cho kết quả mang tính so sánh về cách phân bố của cácnucleotide trong ba NST khác nhau của cùng một vi khuẩn, và cũng để so sánh với sựphân bố của các nucleotide trong NST vi khuẩn đã nghiên cứu [23] Các kết quả naygóp phan cung cấp thông tin cần thiết trong việc chuẩn bị (in silico) cho các nghiêncứu bién đổi hoặc tạo mới DNA NST
1.5 MỤC TIỂU NGHIÊN CUULuận văn nhăm mục tiêu nghiên cứu sự phân bô của các trimer trong các trình tự
sense và antisense trên các replichore của ba NST khác nhau của vi khuẩn B lata 383
1.6 Ý NGHĨA KHOA HỌC VÀ THỰC TIEN CUA DE TÀI1.6.1 Y nghĩa khoa học
Luận văn cung cấp thông tin về cách phân bố của các nucleotide trong NST vikhuẩn trong mối quan hệ với tầm quan trọng của sự phân bố này, bởi vì phá vỡ cáchphân bố này băng cách thay đối vị trí khởi đầu sao chép làm chậm tốc độ sao chép [ 19,20] thay doi sự sắp xếp tự nhiên của các nucleotide trong NST vi khuẩn làm ảnhhưởng nghiêm trọng đến sự phân bồ của các nucleoid vào tế bào mới sau quá trình saochép và làm chậm sự phân chia của tế bào [15, 16], hay không thé thực hiện chèn mộtNST vi khuẩn vào một vị trí trên một NST khác [21], hay việc tạo NST vi khuẩn nhântạo cần các nucleotide tong hợp có trình tự phải giống như trình tự nucleotide trongNST tự nhiên [22] Những đặc điểm tương đồng trong cách phân b6 các trimer trongba NST khác nhau của cùng một vi khuân góp phan làm sáng tỏ các qui luật phân bốtự nhiên chưa được biết đến của các nucleotide trong các NST vi khuẩn
21
Trang 231.6.2 Y nghĩa thực tiễnSự hiểu biết về sự phân bố mang tính qui luật của các nucleotide trong các NSTvi khuẩn sẽ giúp chúng ta can thiệp có định hướng vào việc thay đổi có hiệu qua cáctrình tự nucleotide trong NST băng các kỹ thuật biến đổi DNA hoặc tao ra được cácNST vi khuẩn nhân tạo theo ý muốn.
22
Trang 24CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 VAT LIEU
Đối tượng nghiên cứu là ba trình tự NST hoàn chỉnh của vi khuẩn B lata 383,được tải về dưới dạng các tập tin có đuôi fna từ cơ sở dữ liệu NCBI(ftp://ftp.ncbi.nlm.nih.gov/genomes/archive/old_refseq/Bacteria/Burkholderia_383_ui
d58073) Kích thước va ham lượng GC của các NST vi khuan B lata 383 duoc trinhbày trong Bang 2.1; số lượng va thành phan các nucleotide của chúng được trình bàytrong Bảng 2.2 Số lượng và thành phần nucleotide của các trình tự sense and antisensetrong các NST được trình bay trong Bang 2.3.
Bang 2.1 Kích thước và hàm lượng GC của các NST.
NST NST 1 NST 2 NST 3
(RefSeq*) (NC_007510.1) (NC 0075111) (NC 007509.1)Kích thước NST (bp) 3694126 3587082 1395069
Hàm lượng GC (%) 66.2 66.7 65.3
() RefSeq: số hiệu trình tự NST trên cơ sở dữ liệu NCBI.
Bang 2.2 Số lượng và thành phần nucleotide của các NST
NST 1 NST 2 NST 3F Thành Số Thành F Thành
Nucleotide Sô lượng phan (%) lượng phan (%) Sô lượng phan (%)
A 624915 16.92 595420 16.6 242199 17.36C 1219309 33.01 1194580 33.3 455715 32.67G 1226389 33.2 1199074 33.43 454914 32.61T 623513 16.88 598008 16.67 242241 17.36Bang 2.3 Số lượng và thành phan nucleotide của các trình tự protein sense and
anfisense trong các NST.
NST Số lượng (bp) Thành phan (%)
l 3241389 87.742 3143436 87.633 1195317 85.68
23
Trang 252.2 PHƯƠNG PHÁP NGHIÊN CỨU2.2.1 Xác định nucleotide skew
Điểm khởi đầu và kết thúc sao chép trong mỗi NST được định vị bằng cách xácđịnh mức độ khác nhau về tần suất xuất hiện của G và C trong từng đoạn cục bộ dọctheo trình tự DNA NST, bang cách sử dụng phương pháp đã được xây dựng trước đây
[25].
Sau khi điểm khởi đầu sao chép được xác định, replichore thứ nhất ( RI) sẽ batđầu từ điểm khởi đầu cho tới điểm kết thúc sao chép, và replichore thứ hai (R2) sẽ bắtđầu từ điểm kết thúc cho tới điểm khởi đầu sao chép của NST
2.2.2 Trích xuất các trình tự sense và antisense
Các trình tự protein sense va antisense được trích xuât từ các trình tự NST hoàn
chỉnh nhờ chương trình extractseg của gói EMBOSS [26], trên cơ sở các vi trí đã được
xác định của chúng dọc theo chiêu dai NST trong các tập tin có đuôi ptt trên cơ so dit
liệu NCBI nói trên.
2.2.3 Xác định số lần xuất hiện của trimer trong trình tựSố lần xuất hiện của một trimer trong trình tự là số lần trimer đó xuất hiện dọctheo trình tự mà không chồng lên nhau, theo hướng từ 5' đến 3', được xác định thôngqua một phần mém đã sử dụng trong một nghiên cứu trước đây [27]
2.2.4 Xác định mật độ phân bố của trimer trong trình tựĐề xác định mật độ phân bố của một trimer trong trình tự, số lần xuất hiện củatrimer đó trước hết được xác định như trên (Mục 2.2.3) Sau đó, các giá tri số lần xuấthiện của 64 trimer được chuyển vào bảng tính Excel Mật độ phân bố của một trimerđược tính theo công thức sau:
Mật độ phân bố = x x 1000/LTrong đó x là số lần xuất hiện của mỗi trimer, và L (tính bang bp) là tong chiềudài của tất cả các trình tự được sử dụng để xác định số lần xuất hiện của trimer Mật độphân bố trimer trong trình tự là một bộ gồm 64 giá trị cho 64 trimer
24
Trang 262.2.5 Khao sát sự phân bố của các trimer trên các replichore của NSTCác trình tự sense (hoặc antisense) trên mỗi replichore được nối lại với nhau,theo thứ tự vi trí của chúng trong NST, thành một trình tự mới Vi trí của một trimer
(và trimer BSDN tương ứng) bat kỳ doc theo trình tự mới được xác định băng phanmềm viết theo ngôn ngữ Python, theo chiều 5’ —> 3’, sao cho vị trí của nucleotide thứba cua trimer trong trình tu là vi trí của trimer Chăng hạn, trong trình tựATGAACAGACGGTTCGTTTCGATCGCGTTGATCGCCGCCGGCGGGTGTTTC
GCCAGCGCGAACGCTCGCGCGGAC , vi tri của trimer GCG (gach dưới) là 27,
60, 72, v.v (xem thêm Bang 3.2) Khoảng cách liền kề (D) giữa các trimer (hoặcgiữa các trimer BSDN) trong trình tự mới được xác định băng bp Số lượng các D cógiá tri như nhau được gọi là tần suất xuất hiện của D trong trình tự mới Đề quan sátđược sự phân bố cua trimer (và trimer BSDN tương ứng) trong các trình tự sense (vaantisense) trên hai replichore của NST, đồ thị biểu diễn sự phụ thuộc của tần suất xuấthiện của D vào các giá trị logarith tương ứng của D được xây dựng Hệ số quan hệPearson giữa hai dãy giá trị tần suất xuất hiện của cùng các khoảng cách D được xácđịnh bằng hàm CORREL trong Microsoft Excel
25
Trang 27CHƯƠNG 3 KET QUÁ NGHIÊN CỨU VA BAN LUẬN
3.1 Số lượng các trimer trong các trình tự sense va antisense của NSTCó tất cả 64 trimer được liệt kê trong Bảng 3.1 Mỗi trimer đều có một trimerBSDN tương ứng.
Bang 3.1 Cac trimer và các trimer BSDN tương ứng.
Trimer Trimer Trimer TrimerTrimer BSDN Trimer BSDN Trimer BSDN Trimer BSDNAAA TTT CAG CTG GAG CTC GGT ACCAAG CTT CCA TGG GAT ATC GTA TACACA TGT CCG CGG GCA TGC GTG CACACG CGT CCT AGG GCG CGC GTT AACAGT ACT CGA TCG GCT AGC TAT ATAATG CAT CTA TAG GGA TCC TCA TGAATT AAT GAA TTC GGC GCC TCT AGACAA TTG GAC GTC GGG CCC TTA TAA
Theo [24], mac dù khác nhau về kích thước và trình tự nucleotide, trong tat cảcác trình tự sense và antisense của mỗi NST, mỗi trimer đều xuất hiện với số lần tươngđương với số lần xuất hiện của trimer BSĐN tương ứng Dé xác minh điều này, chúngtôi kiểm tra lại bằng cách trích xuất tat cả các trình tự protein sense và antisense từ mỗitrình tự NST hoàn chỉnh, sử dụng chương trình extractseq của gói EMBOSS [26] Sau
đó, đối với từng NST, chúng tôi tiến hành xác định số lần xuất hiện của các trimertrong tất cả các trình tự sense và antisense vừa trích xuất được Đúng như đã trình bàytrong [24], mỗi trimer đều có số lượng gan bang với số lượng các trimer BSDN tươngứng Kết quả được trình bảy trong Hình 3.1
26
Trang 288000070000® 60000
E
‘5 50000
esa
5 30000«O‹ 20000
Lo i R ï | Ifr.ÍfrlrftFEFPFFFEFEE OOOH OH 0600 OOOO OE OE 0Q Q 0 Ó O OZ 4 4
FrEQOOO < Ee #35300005736 5353051352300152E2585E
of E ö OF So OF O06 F SE tệS) Qe lồ Q 0E << SS OO oreErF FOOelec TF FYQgSrGZFGZGOHQsGsQGSQVsGsoGareRe
Trimer/Trimer BSĐN
B @S+AS_Trimer ®S+AS_Trimer BSĐN70000
60000©f£ 90000+ 40000
2o- 30000
2
so 20000
œ
10000 Ï | | Ï Ï il Ï> ebb Pe BPP ' Iii, -
LÍ | | ffrzfIHIrilleee ' Iii„, _
-L6 cEbEB C000 0 0 0 @0 O0 O O O O O O O O O O O Ò© OÒ 4£ 4 <4== 0 O < had Eee b2
27
Trang 29trong nhóm các trình tự antisense Đồng thời, số lần xuất hiện của mỗi trimer trongnhóm các trình tự antisense lại gần băng với số lần xuất hiện của trimer BSDN tươngứng trong nhóm các trình tự sense (Hình 3.2) Số liệu cho Hình 3.1 và Hình 3.2 đượctrình bày ở Bảng phụ 1, Bảng phụ 2 va Bảng phụ 3 (phần Phụ lục).
A —S_Trimer —=AS_Trimer ~-S_Trimer BSĐN -AS_Trimer BSĐN
500004500040000Ϩ= 35000+ 30000
D 25000Ð- 20000a]
15000
Œ 10000
5000 “ns
a0 ———
FrFrEerE EEF OHO 0 0 0 0 60 O ©Ô O O O O O00 O O O OÓ 00 £< 4x <x— tk < Ee
Or E Ò) OF 0 9 OF Oo 6 t O F 4 t
S) QE lề) Q @ E zao Oo 6 @ tệ = O oO
2<2<eetTFEGFVVggsrsoeGgoQUQgSEQSVROQoreRe
Trimer/Trimer BSĐNB —S_Trimer ——=AS_ Trimer ~=~=S®_Trimer BSĐN -AS_Trimer BSĐNI
4500040000 35000= 30000+ 25000E_ 200005 15000
“© 10000
œ5000
2000
\PFrFREEFREFOOWAOOOAOHOUDOOVOOXOXO0 000K 000 € 4 «
FE OOO a eee lu) ö ö Ö öO 4 4 Š 6 6 á13506200353553Ề358555 500.552 585ÊE
nhóm các trình tự sense va và nhóm các trình tự antisense
28