CHƯƠNG 3. KẾT QUẢ VÀ BÀN LUẬN
3.2. Kết quả tạo dòng và giải trình tự từng phần bộ gen IHHNV
3.2.3. Tổ chức và chức năng của một phần bộ gen IHHNV
Nhằm xác định các vùng chức năng của một phần bộ gen đã giải đã giải trình tự, toàn bộ trình tự gồm 3091 bp (Hình 3.6) được tiến hành phân tích trên máy tính. Các phần mềm BioEdit, DNA club và ORF Finder được sử dụng để phân tích và tìm kiếm các ORF. Phần mềm Neural Network Promoter Prediction
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 71 -
program và hướng dẫn của Alan và James [12 và 26] được sử dụng để dự đoán vùng trình tự có promoter giả định đóng vai trò điều hòa phiên mã. Kết quả thu được như sau:
Bảng 3.2. Tóm tắt các vùng chức năng của một phần bộ gen IHHNV.
Tên các vùng chức năng Vị trí Chức năng dự đoán
Các ORF chính Mã hóa cho:
- ORF1 514 – 1347 Protein không cấu trúc 2 - ORF2 1259 – 2548 Protein không cấu trúc 1 Các promoter
- Promoter của ORF1 353 – 470
- Promoter của ORF2 1170 – 1209 Điều hòa phiên mã Các trình tự bảo tồn
- Trình tự khởi đầu sao chép dạng I
1324 – 1370 - Trình tự khởi đầu sao
chép dạng II
1424 – 1517 Mã hóa cho protein khởi đầu sao chép I và II
- Trình tự NTP binding và enzyme helicase A
2024 – 2090 - Trình tự NTP binding và
enzyme helicase B 2159 – 2189 - Trình tự NTP binding và
enzyme helicase C 2279 – 2297
Mã hóa cho NTP binding protein và enzyme helicase A, B và C
Tín hiệu kiểm soát phiên mã Trình tự polyadenylation
(poly A) 1023 – 1028,
1742 – 1747 Tín hiệu kiểm soát phiên mã Các vùng chức năng chính của bộ gen IHHNV được trình bày tóm tắt ở Bảng 3.2. Theo đó có hai ORF chính được xác định trong một phần bộ gen IHHNV. Các promoter đóng vai trò điều hòa phiên mã được xác định là vùng trình tự nằm phía trước ba ORF chính. Các vị trí polyadenylation đóng vai trò tín hiệu kiểm soát phiên mã cũng đã được xác định. Các trình tự mã hóa cho protein khởi đầu sao chép I và II cũng như các trình tự NTP binding và enzyme helicase A, B và C cũng đã được xác định nằm ở ORF2 của một phần bộ gen.
Chi tiết về cấu trúc của các vùng chức năng chính của một phần bộ gen IHHNV lần lượt được trình bày ở Hình 3.6 và các phần tiếp theo.
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 72 -
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 73 -
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 74 -
Hình 3.6. Chi tiết trình tự nt và tổ chức của một phần bộ gen IHHNV gồm 3091 bp.
Chương 3. Kết quả và bàn luận Phạm Văn Hùng
3.2.3.1. Cấu trúc của các khung đọc mở (ORF)
− ORF1: là một vùng mã hóa lớn đứng thứ hai và chiếm khoảng 26,99 %, nằm phía bên trái, dài 834 nt, bắt đầu tại vị trí nt 514 và kết thúc với mã TAG tại vị trí nt 1347, dự kiến mã hóa cho protein gồm 277 a.a., tương ứng với trọng lượng phân tử là 32,71 kDa (Bảng 3.2và Hình 3.7).
Hình 3.7. Sơ đồ tổ chức của một phần bộ gen IHHNV
Kết quả tìm kiếm khung đọc mở bằng phần mềm ORF Finder trên NCBI. Có hai ORF chính trên một phần bộ gen IHHNV. ORF1 nằm bên trái (mạch +1) và ORF2 nằm ở giữa (mạch +2). Màu xanh là khung đọc mở, màu trắng là đoạn DNA không mã hóa.
− Mức độ tương đồng tối đa về trình tự nt của ORF1 từ 90 – 99 % so với các đại diện IHHNV thu thập trên ngân hàng gen thế giới và 89 % so với trình tự tương đồng với IHHNV nằm trên bộ gen tôm sú (DQ228358). Protein giả định gồm 277 a.a của ORF1 có độ tương đồng là từ 99 % so với trình tự a.a của protein không cấu trúc 2 của các đại diện IHHNV từ các nước như Đài Loan (AAR11284.1), Thái Lan (AAM28235.1) và Ấn Độ (ACA97860.1), 97 % so với protein không cấu trúc 2 của IHHNV phân lập trên tôm sú P. monodon ở Phúc Kiến (ABR23510.1) và 96 % so với Đài Loan (AAR11282.1). Từ những
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 76 -
phân tích trên có thể nhận định rằng ORF1 có khả năng mã hóa cho protein không cấu trúc 2 (NS2). Hay ORF1 có khả năng là gen NS2 mã hóa cho protein không cấu trúc 2.
Bảng 3.3. Mức độ tương đồng tối đa (%) giữa trình tự nt và protein giả định của các ORF so với các IHHNV khác
Độ tương đồng (%) Nucleotide
TT ORF
IHHNV DQ228358.1
Amino acid
1 ORF1 90 - 99 89 96 - 99
2 ORF2 92 - 99 86 92 - 98
− ORF2: là khung đọc mở lớn nhất, chiếm 41,75 %, nằm ở giữa, bắt đầu ở vị trí nt 1259 và kết thúc với mã TAA tại vị trí nt 2548, dài 1290 nt, mã hóa cho protein gồm 429 a.a tương ứng với 49,9 kDa. ORF2 có một phần chồng lấp lên ORF1 gồm 88 nt (Bảng 3.2 và Hình 3.7).
− Trình tự nt của ORF2 có mức độ tương đồng từ 92 % đến 99 % so với ORF tương ứng khác và 86 % so với trình tự DQ228358. Mức độ tương đồng giữa trình tự a.a của protein được mã hóa từ ORF2 so với trình tự protein không cấu trúc 1 của các IHHNV khác là 92 - 98 % (Bảng 3.3). Kết quả này cho phép dự đoán ORF2 là gen NS1 mã hóa cho protein không cấu trúc 1.
3.2.3.2. Trình tự promoter giả định điều hòa phiên mã
− Promoter giả định của ORF1: vùng trình tự nằm phía trước ORF1 từ nt 353 đến nt 470 có thể được xem như là vùng chức năng promoter của ORF1 do phát hiện có một số yếu tố lỏi điển hình của promoter. Bắt đầu là hộp TATA (TATAAA, nt 370 – 376), tiếp theo chiều xuôi là trình tự đóng vai trò là tín hiệu khởi đầu sao chép – Inr (CATT, nt 437 – 440), kế đến là yếu tố điều hòa phiên mã theo chiều xuôi - DPE (AGACC, nt 464 – 468) (Hình 3.8) [14, và 51]. Promoter giả định của ORF1 được tổ chức giống như promoter ở
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 77 -
Nghiên cứu virus IHHNV (Infectious Hypodermal and Haematopoietic Necrosis Virus) trên tôm sú
eukaryote, đã được Alan và cộng sự phát hiện ở ruồi giấm [12].
Hình 3.8. Vùng lỏi (hộp TATA, hộp Inr và DPE) của các promoter giả định có chức năng điều hòa phiên mã ở bộ gen IHHNV
− Promoter giả định của ORF2: quan sát trình tự phía trước của ORF2 cũng có thể được xem như là vùng promoter giả định của ORF2. Bắt đầu là trình tự giàu AT (TATTGA, nt 1170 – 1177), bốn nt GACG (nt 1206 – 1209) đóng vai trò như là DPE [12 và 26]. Tuy nhiên vùng trình tự này thiếu các yếu tố lỏi điển hình của promoter như hộp TATA, hộp Inr (Hình 3.6 và 3.8).
3.2.3.3. Tín hiệu kiểm soát phiên mã
Có hai trình tự AATAAA được tìm thấy trên bộ gen IHHNV. Các trình tự poly A được xem như là những vị trí cho RNA thông tin hoạt động. Trình tự AATAAA thứ nhất nằm ở ORF1, vị trí 1023 – 1028 nt. Trình tự AATAAA thứ hai thuộc ORF2, từ nt 1742 – 1747 (Hình 3.6, Bảng 3.2).
3.2.3.4. Trình tự DNA mã hóa cho protein khởi đầu sao chép và trình tự mã hóa cho NTP liên kết và enzyme helicase A, B và C
Vùng trình tự DNA mã hóa cho khởi đầu sao chép I và II cũng như vùng trình tự mã hóa NTP liên kết và enzyme helicase A, B và C là những vùng trình tự chức năng thường được phát hiện trên parvovirus. Công cụ máy tính được sử
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 78 -
dụng để tìm kiếm các trình tự này. Trình tự protein khởi đầu sao chép I và II được phát hiện ở protein được mã hóa bởi ORF2. Trình tự DNA mã hóa cho protein khởi đầu sao chép I bắt đầu từ nt 1324 kết thúc tại nt 1370 và II bắt đầu tại nt 1424 và kết thúc tại nt 1517 trên bộ gen IHHNV (Hình 3.9 và 3.10). Theo Ilyina và cộng sự (1992) đây chính là những vùng bảo tồn [57].
Hình 3.9. Sơ đồ minh họa các vị trí chức năng trên một phần bộ gen IHHNV.
Trình tự DNA mã hóa cho protein khởi đầu sao chép I (nt 1324 – 1370) và II (nt 1424 – 1517); trình tự DNA mã hóa NTP binding và enzyme helicase A (nt 2024 – 2090), B (nt 2159 – 2189) và C (nt 2279 – 2297) thuộc ORF2.
Ngoài ra NTP liên kết và enzyme helicase A, B và C cũng được phát hiện trong protein được mã hóa từ ORF2. Vùng A bắt đầu từ trình tự nt 2024 và kết thúc tại nt 2090, vùng B từ nt 2159 đến nt 2189 và vùng C từ nt 2279 đến nt 2297 trên ORF2 của một phần bộ gen (Hình 3.9 và 3.10). Theo Walker đây cũng chính là những vùng bảo tồn [59]. Hơn nữa khi sử dụng các trình tự này tìm kiếm trên dữ liệu ngân hàng gen thế giới thì chỉ xuất hiện các đại diện của IHHNV.
Kiểu trình tự DNA mã hóa cho protein khởi đầu sao chép I và II cùng với vùng trình tự DNA mã hóa cho NTP liên kết và enzyme helicase A, B và C cũng đã được Tang và cộng sự phát hiện trên bộ gen IHHNV phân lập ở tôm xanh Thái
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 79 -
Nghiên cứu virus IHHNV (Infectious Hypodermal and Haematopoietic Necrosis Virus) trên tôm sú
Bình Dương (AF218266.2) [56]. Các kiểu trình tự này cũng là trình tự đặc trưng và thường được phát hiện ở các parvovirus khác [50 và 60].
Hình 3.10. Trình tự a.a của protein khởi đầu sao chép I và II cùng với các vùng NTP binding và enzyme helicase A, B và C ở protein được mã hóa từ ORF2.
Vùng trình tự DNA mã hóa cho protein khởi đầu sao chép I và II cũng như vùng trình tự mã hóa NTP liên kết và enzyme helicase A, B và C là các trình tự bảo tồn được xác định nằm trên ORF2 của bộ gen IHHNV sẽ là nguồn thông tin rất có giá trị cho việc thiết kế và lựa chọn mồi đặc hiệu cho phản ứng PCR, góp phần trong việc xây dựng thành công quy trình phát hiện IHHNV.
3.2.3.5. Tổ chức của một phần bộ gen IHHNV
Một phần bộ gen của IHHNV gồm 3091 bp có ít nhất 2 ORF chính đã được xác định gồm ORF1 dài 834 nt, mã hóa cho protein gồm 277 a.a tương ứng với trọng lượng phân tử là 32,71 kDa. ORF1 có khả năng là gen NS2 với chức năng mã hóa cho protein không cấu trúc 2. ORF2 dài 1290 nt, mã hóa cho protein dài 429 a.a, 49,9 kDa. ORF2 có thể là gen NS1 có chức năng mã hóa cho protein không cấu trúc 1. Giữa ORF1 và ORF2 có vùng chồng lấp lên nhau 88 nt.
Chương 3. Kết quả - Bàn luận Phạm Văn Hùng
- 80 -
Có 5 vùng trình tự được xác định là trình tự bảo tồn gồm: hai vùng trình tự mã hóa cho protein khởi đầu sao chép I và II; ba vùng trình tự mã hóa cho NTP liên kết và enzyme helicase A, B và C đều nằm trên ORF2.