CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.2. PHƯƠNG PHÁP NGHIÊN CỨU
Trình tự nhiễm sắc thể
hoàn chỉnh của các vi khuẩn thuộc họ Burkholderiaceae
Xác định các vị trí điểm khởi đầu và kết thúc sao chép trên các nhiễm sắc thể
Trích xuất các trình tự protein sense và antisense
Xác định mật độ phân bố của các trimer trong các trình tự protein sense và antisense
Xác định mức độ thay đổi về mật độ phân bố của các trimer trong các trình tự protein sense và antisense giữa các vi khuẩn
31
Hình 2.1. Cây phát sinh loài trên cơ sở các trình tự 16S rDNA của các vi khuẩn [34].
Hình 2.1 là cây phát sinh loài có gốc (rooted tree) thể hiện thứ tự tiến hóa và khoảng cách tiến hóa giữa các vi khuẩn thuộc họ Burkholderiaceae trên cơ sở các trình tự 16S rDNA của các vi khuẩn này [34]. Theo đó, có một tổ tiên chung của tất cả các loài này phân hóa thành hai nhánh: nhánh thứ nhất (nhánh I) rẽ về phía loài B.
rhizoxinica HKI 454 và các loài phía bên trên; nhánh thứ hai (nhánh II) rẽ về phía loài B. phymatum STM815 và các loài phía bên dưới. Chúng tôi chọn ngẫu nhiên một số loài và B. rhizoxinica HKI 454 trong nhánh I để khảo sát mức độ thay đổi mật độ trimer trong các trình tự protein sense và antisense của các loài này so với của B.
rhizoxinica HKI 454, đồng thời chọn ngẫu nhiên một số loài và B. phymatum STM815 trong nhánh II, và khảo sát tương tự như khảo sát cho các loài trong nhánh I.
2.2.1. Xác định vị trí điểm khởi đầu và kết thúc sao chép
Vị trí điểm khởi đầu và kết thúc sao chép trong mỗi nhiễm sắc thể đƣợc xác định theo các giá trị GC-skew tích lũy dọc theo trình tự DNA nhiễm sắc thể hoàn chỉnh chứa trong các tập tin có đuôi .fna, sử dụng chương trình Genskew online [40].
Replichore thứ nhất ( R1) đƣợc tính từ điểm khởi đầu cho tới điểm kết thúc sao chép, và replichore thứ hai (R2) đƣợc tính từ điểm kết thúc sao chép tới điểm khởi đầu sao chép.
32
2.2.2. Trích xuất các trình tự protein sense và antisense
Các trình tự protein sense và antisense đƣợc trích xuất từ các trình tự nhiễm sắc thể hoàn chỉnh nhờ chương trình extractseq của gói EMBOSS [41], trên cơ sở các vị trí đã đƣợc xác định của chúng dọc theo chiều dài nhiễm sắc thể trong các tập tin có đuôi .ptt trên cơ sở dữ liệu NCBI nói trên.
2.2.3. Xác định tần suất xuất hiện của trimer trong trình tự
Tần suất xuất hiện của một trimer trong trình tự là số lần trimer đó xuất hiện dọc theo trình tự, đƣợc xác định thông qua một phần mềm đã sử dụng trong nghiên cứu trước đây [34]. Tần suất xuất hiện của các trimer trong nhóm các trình tự protein sense hoặc antisense trên mỗi replichore của nhiễm sắc thể đƣợc xác định theo cách không chồng các nucleotide lên nhau dọc theo từng trình tự, theo hướng từ 5' đến 3'. Có tất cả 64 trimer có thể có, trong đó 32 trimer là trimer BSĐN của 32 trimer còn lại (Bảng 2.1).
Bảng 2.1. Các trimer và trimer BSĐN [42].
Trimer Trimer
BSĐN Trimer Trimer
BSĐN Trimer Trimer
BSĐN Trimer Trimer
BSĐN
AAA TTT CAA TTG GAA TTC TAA TTA
AAC GTT CAC GTG GAC GTC TAC GTA
AAG CTT CAG CTG GAG CTC TAG CTA
AAT ATT CAT ATG GAT ATC TAT ATA
ACA TGT CCA TGG GCA TGC TCA TGA
ACC GGT CCC GGG GCC GGC TCC GGA
ACG CGT CCG CGG GCG CGC TCG CGA
ACT AGT CCT AGG GCT AGC TCT AGA
AGA TCT CGA TCG GGA TCC TGA TCA
AGC GCT CGC GCG GGC GCC TGC GCA
AGG CCT CGG CCG GGG CCC TGG CCA
AGT ACT CGT ACG GGT ACC TGT ACA
ATA TAT CTA TAG GTA TAC TTA TAA
ATC GAT CTC GAG GTC GAC TTC GAA
ATG CAT CTG CAG GTG CAC TTG CAA
ATT AAT CTT AAG GTT AAC TTT AAA
2.2.4. Xác định mật độ phân bố của trimer trong trình tự
Mỗi replichore của nhiễm sắc thể có 2 nhóm trình tự. Replichore R1 có nhóm R1-S và nhóm R1-AS; Replichore R2 có nhóm R2-S và nhóm R2-AS. Để xác định mật độ phân bố của một trimer (có thể gọi một cách ngắn gọn là mật độ trimer) trong một nhóm trình tự protein sense hoặc antisense, tần suất xuất hiện của trimer đó trước hết đƣợc xác định nhƣ trong Mục 2.2.3. Sau đó, các giá trị tần suất xuất hiện của 64
33
trimer sẽ đƣợc chuyển vào bảng tính Excel. Mật độ phân bố (MT) của một trimer đƣợc tính theo công thức sau:
MT = x × 1000 / L
Trong đó x là tần suất xuất hiện của mỗi trimer; L (tính bằng bp) là tổng chiều dài của tất cả các trình tự trong nhóm đƣợc sử dụng để xác định tần suất xuất hiện của trimer.
Các giá trị tần suất xuất hiện của 64 trimer của mỗi nhóm trình tự đƣợc chia làm 2 dãy (một dãy gồm 32 giá trị cho 32 trimer, và dãy kia gồm 32 giá trị cho 32 trimer BSĐN tương ứng). Do đó, mỗi nhiễm sắc thể có 8 dãy giá trị mật độ (xem Phụ lục 2, 3, 4 và 5).
2.2.5. Xác định khoảng cách tiến hóa giữa các trình tự protein sense và antisense của hai vi khuẩn khác nhau
Khi vi khuẩn B tiến hóa ra xa vi khuẩn A, khoảng cách tiến hóa d giữa các trình tự protein sense và antisense của hai loài vi khuẩn này đƣợc tính theo công thức sau:
d = 1- r
trong đó, r là hệ số quan hệ Pearson (xác định bằng hàm số CORREL trong Excel) giữa dãy giá trị mật độ trimer trong các trình tự protein sense trên R1 của loài A và dãy tương ứng của loài B, tức giữa R1-S của A và R1-S của B, hoặc giữa R1-AS của A và R1-AS của B, hoặc giữa R2-S của A và R2-S của B, hoặc giữa R2-AS của A và R2-AS của B.
Đối với các vi khuẩn có nhiều nhiễm sắc thể, giá trị mật độ trung bình đƣợc sử dụng. Chẳng hạn, với vi khuẩn có hai nhiễm sắc thể 1 và 2, mật độ trimer trung bình là các giá trị trung bình cộng của các giá trị mật độ của hai dãy giá trị mật độ tương ứng của hai nhiễm sắc thể, ví dụ giữa R1-S của nhiễm sắc thể 1 và R1-S của nhiễm sắc thể 2 (xem Phụ lục 6 và 7).
2.2.6. Xác định mức độ thay đổi của mật độ trimer trong các trình tự protein sense và antisense khi một loài tiến hóa ra xa một loài khác
Đối với mỗi cặp vi khuẩn A và B, với B tiến hóa xa tổ tiên (hoặc tổ tiên trung gian) hơn so với A, giá trị log10(MTB/MTA), trong đó MTA
và MTB tương ứng là mật độ của trimer T (trong R1-S chẳng hạn) của vi khuẩn A và mật độ của trimer T (trong R1-
34
S) của vi khuẩn B, cho biết mức độ khác nhau về mật độ trimer T trong vi khuẩn B so với vi khuẩn A khi vi khuẩn tổ tiên (hoặc tổ tiên trung gian) tiến hóa thành vi khuẩn A và vi khuẩn B. Cụ thể, mật độ trimer T tăng khi log10(MTB/MTA) > 0, giảm khi log10(MTB/MTA) < 0 hoặc không thay đổi khi log10(MTB/MTA) = 0 khi vi khuẩn B tiến hóa ra xa vi khuẩn A.
Đối với các vi khuẩn có nhiều nhiễm sắc thể, giá trị mật độ trung bình đƣợc sử dụng.
2.2.7. Xác định tỉ lệ tăng (hoặc giảm) của mật độ trimer trong các trình tự protein sense và antisense khi một loài tiến hóa ra xa một loài khác
Khi vi khuẩn B tiến hóa ra xa vi khuẩn A, độ tăng (hay giảm) mật độ của một trimer MT chính là hiệu số giữa mật độ trimer trong các trình tự protein sense (hoặc antisense) tương ứng trên từng replichore của nhiễm sắc thể của B so với A, tức là:
MT = MTB - MTA
Trên R1, trong số 32 Trimer, có a Trimer có MT > 0 trong R1-S và b Trimer có
MT > 0 trong R1-AS (với a + b = 32). Đồng thời, trong số 32 trimer BSĐN tương ứng của 32 Trimer, có c Trimer BSĐN có MT > 0 trong R1-S và có d Trimer BSĐN có
MT > 0 trong R1-AS (với c + d = 32). Khi đó, tổng mật độ trimer tăng MTtăng-R1 trên toàn R1 là:
MTtăng-R1= MT-S + MT-AS + MTBSĐN-S + MTBSĐN-AS
Trong đó, MT-S, MT-AS, MTBSĐN-S, MTBSĐN-AS tương ứng là tổng MT
của a Trimer trong R1-S, b Trimer trong R1-AS, c Trimer BSĐN trong R1-S và d Trimer BSĐN trong R1-AS.
Tổng mật độ trimer giảm MTgiảm-R1 trên toàn R1 cũng được tính tương tự cho các Trimer và Trimer BSĐN có MT < 0.
Trên R2, tổng mật độ trimer tăng MTtăng-R2 và tổng mật độ trimer giảm
MTgiảm-R2 đƣợc tính theo cách nhƣ đã tính cho R1.
35
Tỉ lệ % mức tăng của mật độ trimer T (%MT) trên R1 khi B tiến hóa ra xa A đƣợc tính nhƣ sau:
%MT = MT x 100/MTtăng-R1
Tương tự, tỉ lệ % mức giảm của mật độ trimer T (%MT) trên R1 khi B tiến hóa ra xa A là:
%MT = MT x 100/|MTgiảm-R1|
Đối với các vi khuẩn có nhiều nhiễm sắc thể, giá trị mật độ trung bình đƣợc sử dụng.
36