Sau khi khuyếch đại đoạn gen mã hóa protease HIV-1 kích thƣớc khoảng 0,32 kb bằng RT-PCR lồng và kiểm tra sản phẩm PCR bằng điện di trên gel agarose 2%, chúng tôi đã tiến hành gắn đoạn gen này vào vector pCR2.1 và biến nạp vào tế bào khả biến E. coli chủng DH5α. Kết quả biến nạp thu nhận đƣợc hầu hết các khuẩn lạc trắng và một số khuẩn lạc xanh trên môi trƣờng LB có bổ sung kháng sinh ampicillin 50 g/ml, cơ chất X-gal và IPTG làm chất cảm ứng.
Theo lý thuyết thì các khuẩn lạc E. coli màu xanh mang plasmid tự đóng vòng (không chứa gen ngoại lai), gen LacZ của vector pCR2.1 tổng hợp enzyme - galactosidase và trong môi trƣờng có cơ chất X-gal và oxy, chất cảm ứng IPTG; enzyme sẽ chuyển hóa cơ chất thành sản phẩm màu xanh; trong khi đó các khuẩn lạc chứa plasmid tái tổ hợp với đoạn gen chèn đƣa vào làm cho gen lacZ không tổng hợp đƣợc -galactosidase, nên có màu trắng. Tiếp theo, chúng tôi đã lấy ngẫu nhiên một số khuẩn lạc trắng và xanh để kiểm tra sự có mặt của gen mã hóa protease
HIV-1 trong vector bằng PCR sử dụng cặp mồi pCR2.1 xuôi và ngƣợc (pCR2.1-F/ pCR2.1-R) đƣợc thiết kế đặc hiệu cho vector pCR2.1. Theo tính toán, nếu nhân dòng không thành công kết quả PCR dùng cặp mồi pCR2.1-Fw/Rv sẽ nhân lên đƣợc đoạn DNA có kích thƣớc khoảng 300 bp còn trong trƣờng hợp nhân dòng thành công thì PCR sẽ nhân đƣợc đoạn DNA có kích thƣớc 620 bp bao gồm kích thƣớc 320 bp của đoạn gen mã hóa protease HIV-1 gắn vào và đoạn 300 bp của vector pCR2.1.
Kết quả điện di trên gel agarose 2% sản phẩm PCR sử dụng DNA từ 3 khuẩn lạc trắng và 1 khuẩn lạc xanh làm khuôn (hình 3.2A) cho thấy PCR từ khuẩn lạc xanh cho băng DNA có kích thƣớc khoảng 0,3 kb (đƣờng chạy 3) và các sản phẩm PCR từ khuẩn lạc trắng đều cho băng DNA có kích thƣớc khoảng 0,62 kb (các đƣờng chạy 4-6).
Hình 3.2. Điện di gel agarose sản phẩm PCR kiểm tra kết quả biến nạp sử dụng cặp mồi pCR2.1-F/ pCR2.1-R (A) và cặp mồi HIV-F2/ HIV-R2 (B)
1: Thang chuẩn DNA 100 bp
2: Mẫu đối chứng (-), không có DNA 3: Sản phẩm PCR khuẩn lạc xanh
4-6: Sản phẩm PCR khuẩn lạc trắng 1, 2 và 3
Khi sử dụng PCR với cặp mồi đặc hiệu HIV-F2/HIV-R2 (hình 3.2B) cho thấy, sản phẩm PCR từ khuẩn lạc trắng cho băng DNA kích thƣớc khoảng 0,32 kb đặc hiệu cho protease HIV-1 (đƣờng chạy 4-6); trong khi đó, với khuẩn lạc xanh không chứa đoạn gen quan tâm nên không cho băng này (đƣờng chạy 3). Nhƣ vậy, chúng tôi đã thu đƣợc các khuẩn lạc mang plasmid tái tổ hợp pCR2.1 có chứa đoạn gen nhân bản kích thƣớc khoảng 0,32 kb đặc hiệu cho protease HIV-1, vector tái tổ hợp đƣợc ký hiệu là pCR2.1-Prot và đƣợc tách ra ở dạng tinh sạch để cho các nghiên cứu tiếp theo.
3.1.3. Xác định trình tự gen mã hóa protease HIV-1 và phát hiện các đột biến
Để biết chính xác trình tự nucleotide của đoạn gen mã hóa cho protease HIV-1, chúng tôi đã tiến hành giải trình tự đoạn gen này trong vector pCR2.1-Prot thu đƣợc. Kết quả giải trình tự gen mã hóa protease HIV-1 sau đó đƣợc so sánh với trình tự gen tƣơng ứng trong ngân hàng gen thế giới (hình 3.3) cho thấy đoạn gen mã hóa protease HIV-1 có kích thƣớc 297 bp và có độ tƣơng đồng 98% với đoạn gen tƣơng ứng phân nhóm CRF01_AE mã số AB519612 của một số tỉnh miền Bắc Việt Nam. Cụ thể, trình tự gen mã hóa protease HIV-1 thu đƣợc có những nucleotide khác biệt so với trình tự AB519612 là: A6G, G47A, T226C, C278A, T283C, T286C. Trong đó, chỉ có G47A là đột biến còn các vị trí khác còn lại kể cả trình tự nhận biết và phân cắt giới của EcoRI và NdeI là do đƣợc đƣa vào từ trình tự mồi chúng tôi thiết kế ban đầu.
Kết quả so sánh trình tự axit amin suy diễn của protease HIV-1 thu đƣợc với trình tự các axit amin của protease HIV-1 trên ngân hàng dữ liệu HIV quốc tế (HIV database) (hình 3.4) cũng thấy rằng trình tự axit amin của protease HIV-1 trong nghiên cứu có độ tƣơng đồng 97,98% so với trình tự gen tƣơng ứng chủng CRF01_AE của miền Bắc Việt Nam, trong đó có sự thay thế axit amin Gly (G) bằng Glu (E) ở vị trí 16 là do đột biến ở vị trí nucleotide 47 (G47A). Gốc axit amin này không nằm trong trung tâm hoạt động của protease.
pCR2.1-Prot AB519612
Hình 3.3. So sánh trình tự đoạn gen mã hóa protease HIV-1 trong pCR2.1-Prot với trình tự gen tƣơng ứng của chủng CRF01_AE ở miền Bắc Việt Nam (AB519612)
Hình 3.4. So sánh trình tự axit amin của protease HIV-1 trong pCR2.1-Prot với trình tự axit amin của protease HIV-1 phân nhóm CRF01_AE của miền Bắc Việt Nam (AB519612)
Dựa vào các điều kiện RT-PCR thiết lập đƣợc ở trên, chúng tôi đã tiến hành nghiên cứu gen mã hóa protease HIV-1 trên 50 bệnh nhân nhiễm HIV -1 đang điều trị tại Bê ̣nh viê ̣n Bê ̣nh Nhiê ̣t đới Trung ƣơng, trong đó bao gồm huyết thanh của 20 bệnh nhân nhiễm HIV-1 chƣa điều trị ART và 30 bệnh nhân nhiễm HIV đang điều trị bằng thuốc PI ta ̣i bệnh viê ̣n. Qua thí nghiệm chúng tôi chỉ thu đƣợc băng DNA nhân bản bằng PCR từ 8 mẫu huyết thanh , bao gồm 6 mẫu của các bệnh nhân nhiễm HIV-1 chƣa điều trị ART và 2 mẫu c ủa các bệnh nhân đang điều trị PI. Tỷ lệ phát hiện thấp này có thể là do các bệnh nhân đang điều trị HIV-1 bằng thuốc PI có nồng độ virus rất thấp nên khó phát đƣợc hiện bằng RT- PCR. Hơn nữa, để phát hiện sự có mặt của HIV-1 bằng PCR thì gen gag, đƣợc pCR2.1-Prot
xem là bảo thủ nhất giữa các nhóm, phân nhóm HIV-1 và đƣợc dùng làm gen đích, chứ không phải là gen mã hóa protease HIV-1 (Michael và tâ ̣p thể , 1999). Mức độ bảo thủ thấp của gen mã hóa protease HIV-1 cũng có thể là nguyên nhân dẫn đến tỷ lệ phát hiện HIV thấp.
Các sản phẩm PCR chứa các đoạn gen nhân bản (0,32 kb) mã hóa protease HIV-1 từ 8 mẫu huyết thanh khác nhau đã đƣợc gắn trực tiếp vào vector nhân dòng và xác định trình tự. Kết quả phân tích các trình tự nucleotide của gen mã hóa protease HIV-1 thu đƣợc khi so sánh với ngân hàng dữ liệu HIV quốc tế (Ishizaki và tập thể, 2009) cho thấy chúng đều thuộc chủng CRF01_AE đã phân lập đƣợc ở phía Bắc Việt Nam, mã số AB519612 và ở Trung Quốc mã số EU518273 với các hệ số tƣơng đồng trên 96% (hình 3.5). Ngoài ra, kết quả cũng cho thấy, ngoại trừ một số nucleotide sai khác ở hai đầu gen do chúng tôi đƣa vào khi thiết kế mồi, có tổng số 19 sự sai khác về nucleotide giữa gen mã hóa protease HIV-1 trong các mẫu nghiên cứu so với chủng CRF01_AE phân lập ở miền Bắc Việt Nam và Trung Quốc.
Các nghiên cứu khác trƣớc đây cũng cho rằng phân nhóm HIV-1 gây bệnh chủ yếu ở ngƣời Việt Nam là CRF01_AE. Cụ thể, Kato và tập thể (2001) đã xác định trình tự gen gag và env từ các mẫu HIV-1 của 24 bệnh nhân nhiễm HIV-1 tại hai tỉnh gần biên giới phía nam Trung Quốc là Quảng Ninh và Lạng Sơn và cho thấy rằng các chủng HIV-1 phân lập đƣợc đều thuộc phân nhóm CRF01_AE giống với thành phố Pingxiang thuộc tỉnh Quangxi của Trung Quốc. Sự đa dạng di truyền của phân nhóm CRF01_AE thu đƣợc ở Quảng Ninh trong nghiên cứu là rất thấp chỉ có 1,50,6%. Năm 2003, Nguyễn và t ập thể cũng đã xác định trình tự các gen mã hóa protease, env và reverse transcriptase phân lập từ mẫu virus của 200 bệnh nhân nhiễm HIV-1 tại thành phố Hồ Chí Minh và cho thấy rằng có 198 mẫu HIV-1 thuộc chủng CRF01_AE, chỉ có 1 trƣờng hợp thuộc phân nhóm B và 1 trƣờng hợp là dạng tái tổ hợp của B và CRF01_AE. Nghiên cứu của Isizaki và tập thể (2009) trên 760 bệnh nhân nhiễm HIV-1 chƣa điều trị ART ở Hải Phòng cho thấy 98,3% trƣờng hợp HIV-1 thuộc phân nhóm CRF01- _AE giống với miền Nam Trung Quốc, chỉ có 1,4% chủng phân lập thuộc phân nhóm B và 0,3% thuộc phân nhóm tái tổ hợp giữa B và C. Năm 2010, Phan và
tập thể, khi nghiên cứu trên 206 bệnh nhân nhiễm HIV-1 ở miền Bắc Việt Nam chỉ ra rằng chủng CRF01_AE là chủng HIV-1 phổ biến ở miền Bắc Việt Nam. Phân tích cây phân loại cho thấy, chủng CRF01_AE trong nghiên cứu tƣơng đối gần gũi với CRF01_AE của Hải Phòng và miền Nam Trung Quốc nhƣng lại khác với chủng thu đƣợc ở các bệnh nhân ở thành phố Hồ Chí Minh, Campuchia và Thái Lan.
Kết quả nghiên cứu của chúng tôi thu đƣợc là phù hợp với các kết quả của Phan và tập thể (2010) trên các bệnh nhân nhiễm HIV-1 ở một số tỉnh miền Bắc Việt Nam cũng nhƣ một số nghiên cứu khác cho rằng chủng HIV-1 phổ biến ở các tỉnh phía bắc Việt Nam dọc theo biên giới Việt – Trung đến Hà Nội có nguồn gốc từ chủng CRF01_AE của tỉnh GuangXi (Trung Quốc) qua con đƣờng vận chuyển heroin hoặc các hình thức mại dâm. Trình tự gen protease HIV-1 của 8 mẫu nghiên cứu (ký hiệu từ BN1-BN8) đã đƣợc chúng tôi đăng ký vào ngân hàng gen thế giới (GeneBank) với các mã số (accession number) tƣơng ứng là: HQ317454, JF276387, JF276388, JF276389, JF276390, JF276391, HQ890881 và JF276392 (bảng 3.1).
Khi so sánh trình tự axit amin suy diễn của protease HIV-1 từ 8 mẫu nghiên cứu thu đƣợc với cơ sở dữ liệu HIV-1 Stanford (Ishizaki và tập thể, 2009) chúng tôi thấy có 10 loại đột biến thay thế gốc axit amin khác nhau: I13V, I15V, G16E, E35D, M36I, R41K, H69K, V82I, N83T và L89M (bảng 3.1). Trong số này, không có đột biến nào thuộc nhóm đột biến chính kháng thuốc; 2 đột biến M36I và H69K xuất hiện trong tất cả các mẫu nghiên cứu. Các nghiên cứu gần đây cho thấy M36I và H69K là các đột biến kháng nhẹ với thuốc PI mới tiparanavir và s ự xuất hiện với tỉ lệ cao, thƣờng có trong hầu hết các trình tự gen mã hóa protease HIV-1 thuộc phân nhóm CRF01_AE nên chúng đƣợc xem nhƣ sự đa hình tự nhiên (Ishizaki và tâ ̣p thể , 2009; Jullaksorn và tâ ̣p thể, 2010). Các đột biến: I13V (có trong 3/8 mẫu nghiên cứu), E35D (7/8 mẫu); R41K và L89M (có trong tất cả 8 mẫu) là không liên quan đến kháng thuốc PI nào và chúng cũng xuất hiện với tần suất cao (tƣơng ứng là 76,9%, 76,9%, 98,1% và 96,2%) trong tổng số 66 bệnh nhân nhiễm HIV-1 thuộc phân nhóm CRF01_AE ở tỉnh Fujian của Trung Quốc (Liu và tập thể, 2007). G16E và V82I (6/8) là các đột biến xuất hiện với tần suất
cao trong nghiên cứu này và đƣợc xem nhƣ các đột biến kháng nhẹ với thuốc PI atazanavir và ritonavir ở các chủng HIV-1 thuộc phân nhóm B (Johnson và tâ ̣p thể, 2010). Có một đột biến N83T đƣợc tìm thấy ở một bệnh nhân đang điều trị bằng thuốc PI (BN1*). Sự thay thế N bằng T đƣợc xem là hay xảy ra ở vị trí axit amin 83 trên protease HIV-1 phân nhóm B của các bệnh nhân đang điều trị bằng thuốc PI nhƣng chỉ có một vài đột biến nhƣ N83D là làm giảm hiệu quả khi điều trị với tipranavir/r®. Các ảnh hƣởng của N83D đến các PI khác chƣa đƣợc biết đến. Đặc biệt, khi so sánh với các nghiên cứu trƣớc đây về điều tra đột biến trên gen mã hóa protease của phân nhóm CRF01_AE gây bệnh ở ngƣời Việt Nam và trên thế giới, thì đây là nghiên cứu đầu tiên tìm thấy đột biến N83T. Liệu đột biến này có ảnh hƣởng đến hiệu quả xúc tác, mức độ nhạy cảm của enzyme với các chất ức chế hay liên quan đến các đột biến kháng thuốc ở phân nhóm CRF01_AE hay không là vấn đề rất cần đƣợc nghiên cứu.
Qua đây cũng có thể thấy rằng bệnh nhân nhiễm HIV-1 phân nhóm CRF01_AE trƣớc khi điều trị có thể đã mang một số đột biến có khả năng làm giảm tác dụng của tiparanavir.
Tóm lại, phần lớn các nghiên cứu về HIV-1 trên thế giới chủ yếu tập trung vào virus thuộc phân nhóm B, trong khi các phân nhóm không phải phân nhóm B, đặc biệt là CRF01_AE chƣa đƣợc nghiên cứu nhiều (Nguyen và tâ ̣p thể , 2003; Ishizaki và tâ ̣p thể , 2009; Phan và tâ ̣p thể , 2010). Nghiên cứu của chúng tôi góp phần cung cấp thêm thông tin về sự đa hình của gen mã hóa protease HIV-1 của phân nhóm HIV-1 gây bệnh chủ yếu ở Việt Nam và phân nhóm CRF01_AE nói chung. Cần phải có thêm nghiên cứu về protease HIV-1 mang đột biến N83T. Đồng thời thấy đƣợc vai trò quan trọng của xét nghiệm kháng thuốc theo hƣớng phát hiện đột biến gen mã hóa protease HIV-1 trong việc xây dựng phác đồ điều trị HIV/AIDS cho mỗi bệnh nhân nhiễm HIV-1.
Hình 3.5. So sánh trình tự các gen mã hóa protease HIV-1 từ các bệnh nhân khác nhau với đoạn gen tƣơng ứng của chủng CRF01_AE của miền Bắc Việt Nam (AB519612) và Trung Quốc (EU518273)
Các nucleotide sai khác giữa các mẫu nghiên cứu so với chủng
CRF01_AE của miền Bắc Việt Nam và Trung Quốc đƣợc đánh dấu bằng màu hồng
Bảng 3.1. Một số đột biến trong gen mã hoá protease HIV-1 phân lập tại Việt Nam
ST T Mã bệnh nhân Ký hiệu mẫu Mã số (accession number) đăng ký trong ngân hàng gen thế giới Đột biến (đƣợc dịch ra mức protein) 1 BN1 01VN.HN232 09
HQ317454 G16E, E35D, M36I, R41K, H69K, V82I, L89M
2 BN2 03VN.HN060
9
JF276387 I13V, G16E, E35D, M36I, R41K, H69K, L89M
3 BN3 04VN.HN060
9
JF276388 G16E, E35D, M36I, R41K, H69K, V82I, L89M
4 BN4 05VN.HN060
9
JF276389 G16E, E35D, M36I, R41K, H69K, V82I, L89M
5 BN5 06VN.HN060
9
JF276390 G16E, E35D, M36I, R41K, H69K, V82I, L89M
6 BN6 07VN.HN060
9
JF276391 G16E, E35D, M36I, R41K, H69K, V82I, L89M
7 BN1* 02VN.HN275 10
HQ890881 I13V, I15V, M36I, R41K, H69K, N83T, L89M
8 BN2* 08VN.HN275 10
JF276392 I13V, E35D, M36I, R41K, H69K, V82I, L89M
Ghi chú: * Bệnh nhân đang điều trị bằng thuốc PI
3.2. NGHIÊN CỨU BIỂU HIỆN GEN MÃ HÓA PROTEASE HIV-1 TRONG E. COLI COLI
Gen mã hóa protease HIV-1 tinh sạch từ huyết thanh bệnh nhân số 1 (BN1) đã đƣợc đăng ký vào ngân hàng gen thế giới với ký hiệu mẫu 01VN.HN23209 và mã gen HQ317454 đƣợc chúng tôi chọn để biểu hiện ở E. coli. Trình tự gen này chỉ mang các đột biến thƣờng gặp ở gen mã hóa protease HIV-1 phân nhóm CRF_01AE.
3.2.1. Nghiên cứu biểu hiện gen mã hóa protease HIV-1 bằng vector pET28a
Phần lớn các nghiên cứu trƣớc đây đều biểu hiện protease HIV-1 ở vi khuẩn
E. coli dƣới dạng tự cắt khỏi trình tự cắt đặc hiệu thƣờng là giữa Phe/Tyr–Pro để giải phóng protease HIV-1 mở đầu bằng axit amin Pro (Graves và tập thể , 1988; Danley và tập thể , 1989; Taylor và tâ ̣p thể , 1992; Mildner và tâ ̣p thể , 1994). Tuy nhiên, Leuthardt và Roesel (1993) đã nhân dòng và biểu hiện protease HIV-1 tái tổ hợp bằng hệ thống vector pDS56/3H-3H ở E. coli. Với hệ thống này, protease mở đầu bằng Met và đƣợc gắn thêm 3 gốc histidine (3xHis) ở đầu cùng N, đầu cuối C để thuận tiện cho quá trình tinh sạch; không cần thiết kế trình tự tự cắt. Dựa trên nghiên cứu của Leuthardt và Roesel (1993), điều kiện sẵn có của phòng thí nghiệm cùng với kinh nghiệm đã biểu hiện một protein khác ở vector pET28a, bƣớc đầu chúng tôi chọn vector pET28a để biểu hiện protease HIV-1 ở E. coli.
Hệ thống vector pET đƣợc xem là một trong các hệ thống vector mạnh nhất cho biểu hiện protein tái tổ hợp ở vi khuẩn hiện nay. Các gen đích khi đƣa vào vector pET đƣợc điều khiển dịch mã bằng promoter T7 của thực khuẩn thể cùng với T7 RNA polymerase; protein đích có thể đƣợc biểu hiện tới hơn 50% protein tổng số của tế bào chỉ sau vài giờ cảm ứng. Vector pET28a có 2 trình tự 6xHis ở phía trƣớc và sau của vùng nhân dòng đa điểm cắt (MCS). Tuy nhiên, với việc thiết kế mồi nhƣ đã nêu mục 3.1.1 thì gen mã hóa protease HIV-1 sau khi đƣa vào chỉ có một trình tự 6xHis ở đầu N của chuỗi polypeptide do mã kết thúc đã đƣa ngay vào trƣớc trình tự cắt của EcoRI. Nhƣ vậy sau biểu hiện, protease HIV-1 trong nghiên