LIỆU TRÌNH TỰ GENOME CỦA CÁC GIỐNG LÚA BẢN ĐỊA ĐÃ ĐƯỢC GIẢI MÃ
Dựa trên cơ sở dữ liệu trình tự genome của 17 giống lúa kháng đạo ôn bản địa của Việt Nam được cung cấp bởi Trung tâm Tài nguyên Thực vật đã được giải trình tự, tiến hành tầm soát đối chiếu trình tự gen Pit lần lượt với từng trình tự genome của 17 giống lúa bằng phần mềm NextGENe V2.4.2.3.
Trình tự gen của gen Pit được lấy từ cơ sở dữ liệu của NCBI (https: //www.ncbi.nlm. nih.gov) và chuỗi tham chiếu được lấy từ cơ sở dữ liệu công bố (http://rice.plantbiology.msu.edu/cgi-bin/sequence_display.cgi?orf=LOC_
Os01g05620) là LOC_Os01g05620 với trình tự bộ gen có 2970 nucleotide, vùng CDS (Coding DNA Sequence) có 2970 nucleotide (nu) mã hóa cho 989 amino acid. Vì trình tự bộ gen và vùng CDS của gen Pit đều có 2970 nucleotide nên gen
Pit không chứa vùng intron trong trình tự gen mà chỉ có chứa vùng exon mã hóa cho RNA thực hiện phiên mã.
Sử dụng phần mềm NextGENe V2.4.2.3 dựa vào trình tự genome của 17 giống lúa bản địa đã giải trình tự, tiến hành tìm trình tự tương đồng của 17 giống lúa đã giải trình tự và so sánh với locus gen Pit đã được công bố cho thấy đã tìm được 17 đoạn ADN tương đồng với trình tự gen Pit (LOC_Os01g05620) tương ứng với 17 giống lúa. Sự thay đổi về tỷ lệ T, C, A, G cũng như nucleotit tổng số giữa các giống lúa và so với giống tham chiếu được tổng hợp trong bảng 4.1 sẽ là cơ sở dữ liệu giúp xác định các SNP và các Indel khi chúng được phân tích kết hợp cùng với số liệu thống kê về trình tự nucleotit trong vùng CDS và trình tự mã hóa của các amino acid (Bảng 4.2). Phần mềm NextGENe là một trong những phần mềm có độ chính xác cao bên cạch các phần mềm CLC, Trinity, SOAP, Oases, ABySS trong việc tìm kiếm các đoạn trình tự tương đồng, các SNP, Indel từ thư viện hệ gen đã được giải trình tự của sinh vật (Wei Tang và Anna Y. Tang., 2019; Nikola Hájková et al., 2019).
Kết quả tầm soát trình tự gen Pit (LOC_Os01g05620) tham chiếu bằng phần mềm NextGENe V2.4.2.3 đã thu được ở mỗi giống có một đoạn trình tự tương đồng trên cả 17 giống lúa bản địa với tỷ lệ 100% 17/17 giống lúa (Bảng 3.1). Vào năm 2017, bằng một phương pháp tương tự đã tầm soát trình tự gen
SRWD2 tham chiếu (LOC_Os02g48964.1) bằng phần mềm NextGENe_V2.3 đã thu nhận được mỗi giống một đoạn trình tự ở chín giống Tẻ nương, Nếp mèo nương, Hom râu, Xương gà, Nàng quớt biển, Nếp bồ hóng Hải Dương, OM3536, IS1.2 and Một bụi đỏ trên 36 giống lúa bản địa Việt Nam: Tám xoan Bắc Ninh, Tám xoan Hải Hậu, Tẻ Nương, Nàng thơm chợ đào, Thơm Lài, Nếp mặn, Chiêm đỏ, Lúa Ngoi, Một bụi đỏ, Nàng cờ đỏ 2, Ble te lo, Chiêm nhỡ Bắc Ninh 2, Nếp lùn, Khấu mặc buộc, OM6377, Chấn thơm, Xương gà, Khấu giáng, Coi ba đất, OM5629, Nếp bồ hóng Hải Dương, Tan ngần, Ba cho K’te, Blao sinh sai, Nàng quớt biển, Tép Thái Bình, Khấu điển lư, Nếp mèo nương, Tốc lùn, Hom râu, Nếp ông táo, OM3536, Khấu Liến, Lúa gốc đỏ, Chiêm đá, IS1.2 với tỷ lệ 25% 9/36 giống lúa (Huu Trung Khuat và cs., 2017).
Bảng 4.1 cho thấy đã thu nhận được 9 đoạn trình tự tương đồng của 9 giống lúa bản địa Việt Nam có độ dài ít hơn 3 nucleotide (nu) ở vị trí số 543, 544 và 545 so với gen tham chiếu Pit, đó là các giống: Khấu điển lư, Thơm Lài, OM6377, Tép Thái Bình, Tám xoan Hải Hậu, Hom râu, Khẩu Liến, Tám xoan Bắc Ninh và Nàng quớt biển. Tuy nhiên, đoạn trình tự tương đồng với gen Pit
của 9 giống lúa trên có tỉ lệ phần trăm các loại C, A, G và T(U) có sự khác nhau và khác với gen tham chiếu (Bảng 4.1).
8/17 giống còn lại (Nếp mặn, Lúa gốc đỏ, Ble te lo, Chiêm nhỡ Bắc Ninh 2, Nếp lùn, Khấu mặc buộc, Nếp mèo nương và Tốc lùn) có độ dài ít hơn 20 nucleotide so với gen tham chiếu trong đó mất 3 nu như 9 giống ở trên và mất thêm 17 nu ở vị trí từ số 2647 đến 2664 (Hình 4.1). Tám đoạn trình tự của tám giống này có tỷ lệ A, T(U), G, C sai khác so với gen tham chiếu (Bảng 4.1).
Bảng 4.1. Bảng thống kê số lượng và tỉ lệ nucleotide của các gen Pit ở các giống lúa đã giải trình tự
Tên giống lúa và gen tham chiếu
Tỷ lệ nucleotide (%)
Tổng số nucleotide T(U) C A G CG AT
LOC_Os01g05620 (PIT) 27,6 19,1 30,2 23,1 42,2 57,8 2970,0 Khấu điển lư 27,0 19,1 31,0 22,9 42,0 58,0 2967,0 Thơm Lài 26,7 19,2 31,5 22,6 41,8 58,2 2967,0 OM6377 27,0 19,1 31,4 22,5 41,7 58,3 2967,0 Tép Thái Bình 26,4 19,4 31,9 22,3 41,7 58,3 2967,0
Tám xoan Hải Hậu 26,8 19,3 31,1 22,8 42,1 57,9 2967,0 Hom râu 26,9 19,2 31,0 22,9 42,1 57,9 2967,0 Khẩu Liến 26,9 19,2 30,9 23,0 42,2 57,8 2967,0 Tám xoan Bắc Ninh 26,3 19,4 31,6 22,7 42,1 57,9 2967,0 Nàng quớt biển 26,7 19,4 31,1 22,8 42,2 57,8 2967,0 Nếp mặn 26,6 19,2 31,4 22,8 42,0 58,0 2950,0 Tốc lùn 27,2 18,9 30,8 23,1 42,0 58,0 2950,0 Chiêm nhỡ Bắc Ninh 2 27,1 19,1 30,8 23,0 42,1 57,9 2950,0 Nếp lùn 26,7 19,2 31,4 22,7 41,9 58,1 2950,0 Ble te lo 26,6 19,4 31,2 22,8 42,2 57,8 2950,0 Khấu mặc buộc 26,8 19,2 31,1 23,0 42,2 57,8 2950,0 Nếp mèo nương 26,7 19,2 31,2 22,9 42,1 57,9 2950,0 Lúa gốc đỏ 26,8 19,2 31,2 22,8 42,0 58,0 2950,0 Hình 4.1. Ảnh dóng hàng, dóng cột so sánh trình tự một đoạn gen kháng đạo ôn Pit của một số giống lúa bản địa
Hình 4.2. Vị trí 3 nucleotide bị thiếu ảnh hưởng làm mất 2 amino acid sau khi dịch mã
Kết quả tầm soát bằng phần mềm NextGENe V2.4.2.3 cho thấy 17/17 giống lúa bản địa đều xuất hiện một đoạn trình tự tương đồng và thông qua việc để dóng hàng, cột bằng phần mềm MEGA 6.0 cho thấy chỉ có 9/17 giống mang gen
Pit với tỷ lệ 52,94%. Trong khi đó, Khuất Hữu Trung và cộng sự nghiên cứu tầm soát gen SRWD2 được kết quả là 9/36 giống lúa bản địa xuất hiện một đoạn trình tự tương đồng và thông qua việc dóng hàng, cột bằng phần mềm MEGA 6.0 cho thấy chỉ 1/9 giống mang gen SRWD2 với tỷ lệ 11,11%.
Sau khi sử dụng phần mềm MEGA 6.0 để dóng hàng, cột so với gen Pit tham chiếu, tiến hành dịch mã cho thấy 3 nu bị thiếu làm mất 2 amino acid sau khi dịch mã (Hình 4.2) (Zheng, S et al., 2017; Tamura et al., 2013; Huu Trung Khuat và cs., 2017). Kết quả phân tích tổng số amino acid và dịch mã sang protein cho thấy 9 giống lúa Khấu điển lư, Thơm Lài, OM6377, Tép Thái Bình, Tám xoan Hải Hậu, Hom râu, Khẩu Liến, Tám xoan Bắc Ninh và Nàng quớt biển có chiều dài tương đương với gen tham chiếu (ít hơn 3 nucleotide) nhưng lại có số lượng các amino acid khác nhau và có sự sai khác về trình tự protein (Bảng 4.2).
Thông qua việc phân tích tổng số amino acid (aa) và thành phần amino acid của gen Pit cho thấy tổng số amino acid của 17 giống lúa dao động từ 980 đến 987 aa. Trong đó Leucine thu được số amino acid nhiều nhất, dao động từ 140 đến 144 aa và Tryptophan thu được số aa ít nhất, dao động từ 15 đến 16 aa. Kết quả tầm soát 17 giống lúa nghiên cứu thu được 9 giống lúa: Khấu điển lư, Thơm Lài, OM6377, Tép Thái Bình, Tám xoan Hải Hậu, Hom râu, Khẩu Liến, Tám xoan Bắc Ninh và Nàng quớt biển có tổng số amino acid và thành phần amino acid tương đồng giống với gen tham chiếu (987 với 989 amino acid). Sáu giống: Nếp mặn, Chiêm nhỡ Bắc Ninh 2, Nếp lùn, Ble te lo, Khấu mặc buộc và Nếp mèo nương có tổng số amino acid là 981 amino acid nhưng số lượng từng amino acid khác so với gen tham chiếu. Hai giống Tốc lùn và Lúa gốc đỏ còn lại có tổng số amino acid ít hơn 9 aa gen tham chiếu (Bảng 4.2).