Nội dung nghiên cứu được chia làm hai phần và thực hiện qua các bước sau:
a. Phân lập gen mã hóa yếu tố đông máu IX từ mô gan sinh thiết ở người
Tách chiết RNA tổng số từ mô gan sinh thiết của người bằng trizol.
Tổng hợp cDNA từ RNA tổng số nhờ việc sử dụng mồi Oligo (dT) và enzyme phiên mã ngược SuperScriptTM
II Reverse Transcriptase (RT).
Khuếch đại toàn bộ cDNA mã hóa FIX bằng phản ứng PCR với cặp mồi đặc hiệu (F1/R1) đã được thiết kế dựa trên trình tự có sẵn của gen FIX trên ngân hàng
gen quốc tế GenBank (mã số NM_000133).
Ghép nối cDNA mã hóa FIX với vector tách dòng pJET1.2 tạo plasmid tái tổ hợp, kí hiệu là pJET1.2/FIX và biến nạp sản phẩm ghép nối này và tế bào khả biến
E. coli DH5α bằng phương pháp sốc nhiệt.
Kiểm tra cDNA mã hóa FIX trong vector tách dòng bằng enzyme hạn chế và giải trình tự.
b. Thiết kế vector biểu hiện mang cDNA mã hóa FIXnoSP và biểu hiện trong tế bào vi khuẩn E. coli BL21(DE3)
Nhân đoạn cDNA mã hóa FIX với chuỗi polypeptide cắt tín hiệu tiết đầu N, (kí hiệu là FIXnoSP) từ khuôn là plasmid tái tổ hợp pJET1.2/FIX bằng cặp mồi đặc hiệu (F4/R5).
Cắt sản phẩm PCR bằng các enzyme hạn chế, đồng thời cắt vector pET32a bằng các enzyme hạn chế tương ứng.
Ghép nối đoạn cDNA mã hóa FIXnoSP vào vector biểu hiện pET32a tạo plasmid tái tổ hợp pET32a/ FIXnoSP và biến nạp vào chủng biểu hiện E. coli DH5α
bằng phương pháp sốc nhiệt. Theo cách thiết kế này, FIXnoSP sẽ được biểu hiện ở dạng dung hợp với TrxA.
Kiểm tra cDNA mã hóa FIXnoSP trong vector biểu hiện bằng enzyme hạn chế và giải trình tự.
50
Biến nạp các vector tái tổ hợp (pET32a và pET32a/ FIXnoSP) vào chủng biểu hiện E. coli BL21(DE3) bằng phương pháp sốc nhiệt.
Cảm ứng biểu hiện protein dung hợp.
Kiểm tra protein dung hợp bằng phương pháp điện di SDS-PAGE.
Quy trình phân lập và biểu hiện gen mã hóa yếu tố đông máu IX trong tế bào
E.coli BL21(DE3) được tóm tắt ở Hình 16 và Hình 17.
Hình 16. Sơ đồ quá trình phân lập và dòng hóa cDNA mã hóa yếu tố đông máu IX (FIX).
51
Hình 17. Sơ đồ quy trình thiết kế vector biểu hiện mang cDNA mã hóa FIXnoSP và biểu hiệu trong tế bào vi khuẩn E. coli BL21(DE3).
52
Chƣơng 3. KẾT QUẢ VÀ THẢO LUẬN 3.1. Phân lập gen mã hóa yêu tố đông máu IX ở ngƣời
3.1.1. Thu thập mẫu mô gan sinh thiết ngƣời
Do yếu tố đông máu IX người được tổng hợp chủ yếu ở các tế bào mô gan nên chúng tôi đã chọn mô gan làm nguyên liệu nghiên cứu. Phối hợp với Bệnh viện K, chúng tôi đã chọn được mẫu mô gan sinh thiết từ 2 trong số 7 người (Bảng 8) dùng cho việc tách RNA tổng số để phân lập gen FIX.
Bảng 8. Danh sách người cho mẫu.
STT Tên Giới tính Tuổi Mẫu mô gan (g)
1 Lương Mỹ H. Nữ 28 2-3
2 Nguyễn Tuấn N. Nam 30 2-3
3.1.2. Tách chiết RNA tổng số
Sản phẩm RNA tổng số tách chiết từ 2 mẫu mô gan sinh thiết bằng phương pháp trizol được điện di biến tính trên gel agarose 1% (Hình 18). Kết quả điện di thể hiện rõ các băng 28S, 18S và 5S rRNA, không có hiện tượng bị phân hủy do quá trình tách chiết.
Hình 18. Điện di đồ sản phẩm RNA tổng số trên gel agarose 1%. 1 - 2: Sản phẩm RNA tổng số của 2 mẫu mô gan sinh thiết người.
53
Như vậy, chúng tôi đã tách chiết được RNA tổng số từ 2 mẫu mô sinh tiết gan ở người. Mẫu RNA tổng số tách từ mẫu mô gan sinh thiết của Lương Mỹ H. được sử dụng làm nguyên liệu cho việc tổng hợp cDNA mã hóa FIX ở người.
3.1.3. Tạo dòng và xác định trình tự gen FIXThiết kế cặp mồi và PCR Thiết kế cặp mồi và PCR
Để phân lập được đoạn cDNA mã hóa cho protein FIX từ RNA tổng số, cần phải có một cặp mồi đặc hiệu cho phản ứng nhân gen FIX bằng kỹ thuật PCR từ
cDNA sợi đơn được tổng hợp từ phản ứng RT-PCR. Trên cơ sở trình tự mRNA mã hóa protein FIX của người đã công bố trên Ngân hàng trình tự gen Quốc tế GENBANK/DDBJ/EMBL (mã số NM_000133), chúng tôi đã thiết kế cặp mồi nhân cDNA mã hóa FIX như sau:
FIX-F1: 5’ - GCT AGC AAA GGT TAT GCA GCG C -3’ FIX-R1: 5’- GGA AAT CCA TCT TTC ATT AAG TG -3’
Từ nguồn RNA tổng số đã tách được, chúng tôi đã tiến hành làm phản ứng tổng hợp cDNA sợi đơn từ RNA tổng số này thông qua việc sử dụng Oligo(dT) và enzyme phiên mã ngược SuperScriptTM
II Reverse Transcriptase (RT). Sau đó, mẫu cDNA tổng số này được dùng làm khuôn cho phản ứng nhân cDNA mã hóa cho FIX bằng enzyme Pfu cùng với cặp mồi đặc hiệu (F1/R1). Chúng tôi sử dụng enzyme Pfu DNA polymerase với mục đích là hạn chế tối thiểu việc tạo ra các đột biến điểm không mong muốn trong quá trình nhân cDNA. Trong phản ứng nhân cDNA mã hóa FIX, chúng tôi đã tối ưu được nhiệt độ thích hợp nhất cho việc gắn mồi là 55oC. Sản phẩm RT-PCR sau đó được kiểm tra bằng phương pháp điện di trên gel agarose 0,8% (Hình 19).
Kết quả điện di cho thấy, sản phẩm PCR thu được một băng đặc hiệu có kích thước khoảng 1,4 kb phù hợp với kích thước tính toán lý thuyết của cDNA mã hóa cho FIX. Như vậy, sản phẩm PCR đã đạt độ đặc hiệu về kích thước và đảm bảo về nồng độ để sử dụng cho các thí nghiệm tiếp theo.
54
Hình 19. Điện di đồ sản phẩm PCR nhân gen cDNA mã hóa FIX trên gel agarose 0,8%. M: Marker 1 kb (Fermentas); 1: Sản phẩm PCR nhân gen FIX.
Tạo dòng đoạn cDNA mã hóa protein FIX trong vector pJET1.2
Để tạo cơ sở cho thí nghiệm thiết kế vector biểu hiện mang cDNA mã hóa cho FIX, chúng tôi đã tiến hành tạo dòng phân tử sản phẩm RT-PCR (tức là nhân bản chúng trong tế bào chủ dưới dạng một plasmid tái tổ hợp mang đoạn cDNA này).
Tinh sạch sản phẩm PCR và gắn vào vector tách dòng
Để việc gắn đoạn cDNA vào vector tách dòng đạt hiệu quả, sản phẩm PCR phải được làm sạch, chỉ thu một băng đặc hiệu và đồng thời loại bỏ được các thành phần tạp chất có trong sản phẩm PCR như mồi, đệm, enzyme, dNTPs... Bằng cách này, chúng ta có thể thu lại được khoảng 85% sản phẩm PCR. Sau đó, kết quả tinh sạch được kiểm tra trên gel agarose 0,8%.
Sản phẩm RT-PCR sau khi tinh sạch, được tiến hành gắn vào vector pJET1.2 với thành phần phản ứng như sau:
55
Thành phần Thể tích (μl)
Vector tách dòng pJET1.2 1,0
Sản phẩm RT-PCR 8,0
Enzyme T4-DNA ligase 1,0
Ủ hỗn hợp phản ứng ghép nối ở nhiệt độ phòng trong 40 phút. Bảo quản ở 4oC qua đêm.
Sau đó, chúng tôi đã lấy 5 μl sản phẩm ghép nối này và biến nạp vào tế bào khả biến E. coli chủng DH5α bằng phương pháp sốc nhiệt. Kết quả chúng tôi đã thu được rất nhiều khuẩn lạc trên đĩa. Theo lý thuyết, các khuẩn lạc mọc được trên đĩa là các khuẩn lạc có mang vector pJET1.2 tái tổ hợp. Tuy nhiên, để xác định các khuẩn lạc đó có thực sự mang vector pJET1.2 tái tổ hợp hay không, chúng tôi đã tiến hành tách chiết plasmid từ 11 khuẩn lạc để kiểm tra kích thước plasmid.
Tách chiết DNA plasmid
Các dòng khuẩn lạc sẽ được nhặt nuôi trong môi trường LB lỏng để thu sinh khối và tách DNA plasmid.
Để tách chiết DNA plasmid, cần tiến hành nuôi cấy một số khuẩn lạc trong môi trường LB lỏng bổ sung kháng sinh Amp với nồng độ 100 μg/ml ở 37oC trong khoảng thời gian từ 12-14 giờ và tiến hành tách chiết DNA plasmid theo phương pháp đã được trình bày ở mục (2.2.9). Cụ thể, chúng tôi đã tiến hành tách chiết plasmid từ 11 khuẩn lạc. Sản phẩm tách chiết plasmid được kiểm tra bằng điện di trên gel agarose 0,8% (Hình 20). Các plasmid có kích thước lớn hơn kích thước của plasmid đối chứng âm là các plasmid có khả năng mang sản phẩm RT-PCR.
Từ kết quả điện di sản phẩm DNA plasmid, chúng tôi có thể sơ bộ kết luận các dòng vi khuẩn (2, 4 và 9) chứa plasmid tái tổ hợp mang đoạn sản phẩm RT-PCR.
56
Hình 20. Điện di đồ kiểm tra plasmid tái tổ hợp trên gel agarose 0,8%.
1: Đối chứng âm (vector pJET1.2 không mang đoạn đoạn sản phẩm RT-PCR); 2- 12: Plasmid tái tổ hợp của 3 dòng vi khuẩn mang (giếng số 2, 4 và 9) và không mang sản phẩm RT-PCR (giếng số 3, 5, 6, 7, 8, 10, 11 và 12).
Kiểm tra plasmid tái tổ hợp bằng enzyme hạn chế
Chúng tôi đã tiến hành xử lý plasmid của các dòng số hai, bốn và chín (ký hiệu: dòng pJET1.2/FIX_p18, pJET1.2/FIX_p19 và pJET1/FIX_p22) bằng hai enzyme hạn chế XbaI và XhoI. Kết quả cho thấy, plasmid của 3 dòng này khi được xử lý bằng hai enzyme nói trên đã cho hai băng: một băng có kích thước khoảng 3,0 kb (tương đương với kích thước của vector pJET1.2) và một băng có kích thước khoảng 1,4 kb (tương đương kích thước của sản phẩm PCR) (Hình 21).
Hình 21. Điện di đồ kiểm tra plasmid tái tổ hợp mang cDNA của gen FIX
bằng enzyme hạn chế XbaI và XhoI.
M: Marker 1kb (Fermentas); 1: Sản phẩm PCR của cDNA mã hóa FIX; 2, 3, 4: Sản phẩm xử lý pJET1.2/FIX_p18; pJET1.2/FIX_p19, pJET1.2/FIX_p22 bằng XbaI + XhoI; 5: Sản phẩm xử lý pJET1.2/XbaI + XhoI.
57
Như vậy, đoạn cDNA mã hóa cho protein FIX đã được tách dòng thành công trong vector pJET1.2. Các plasmid tái tổ hợp được tách chiết với lượng lớn và được tinh sạch cho phản ứng xác định trình tự.
Trình tự nucleotide của FIX
Để khẳng định chính xác sản phẩm tách dòng là đoạn cDNA của gen FIX,
sản phẩm được tiếp tục xác định trình tự nucleotide. Sau khi phân tích trình tự cả 3 dòng plasmid tái tổ hợp, đoạn cDNA có chiều dài 1386 bp, khung dịch mã được xác định mã hóa yếu tố đông máu IX gồm 461 amino acid kể cả mã kết thúc (Hình 22).
Khi so sánh trình tự cDNA đầy đủ của gen FIX được phân lập từ mô gan sinh thiết của người Việt Nam với trình tự trên ngân hàng GenBank (NM_000133), chúng tôi thấy ở dòng p18 có sai khác ở 6 vị trí nucleotide dẫn đến sai khác ở 3 vị trí amino acid: c.56T>C (p.L19P), c.608A>G (p.N203S), c.1100T>C, c.1296T>C, c.1314A>G và c.1376A>T (p. K459M); ở p22 có sai khác ở 3 nucleotide dẫn đến sai khác ở 1 vị trí amino acid: c.414T>C, c.1078T>C (p.F360L) và c.1341A>G và dòng p19 có độ tương đồng là 100% ở cả mức độ nucleotide và amino acid. Nhiều công bố nghiên cứu về thay đổi của cấu trúc gen có ảnh hưởng đến chức năng protein FIX, cụ thể là nghiên cứu đột biến trong cDNA của gen FIX gây bệnh
Hemophilia B, cũng đã được thực hiện. Theo thống kê của Ngân hàng đột biến gen người, đột biến trên FIX bao gồm nhiều loại: đột biến điểm thay đổi nucleotide dẫn đến sai khác amino acid, mất đoạn và thêm đoạn [72], các đột biến tìm thấy nằm ở các vùng khác nhau của gen. Nhờ sử dụng mẫu dò DNA nhóm tác giả Chen, một trong những nhóm đầu tiên nghiên cứu đột biến ở gen FIX, đã xác định được đột
biến mất đoạn ở 7 thành viên trong một gia đình mắc bệnh Hemophilia B nặng [25]. Đột biến mất đi điểm cắt của enzyme giới hạn TaqI ở đầu 5’ exon 8 của gen FIX
được tìm thấy ở một bệnh nhân mắc bệnh Hemophilia B nặng [51]. Tiếp đó, rất nhiều đột biến điểm thay đổi nucleotide dẫn đến thay đổi amino acid như: p.Arg4Gln; p.Gly60Ser, p.Glu27Lys, p.Arg29Ter, p.Glu27Val, p.Gly94Arg, p.Gly48Arg… được công bố [34], [48]. Mặc dù cho tới nay chưa có một công bố nào về ảnh hưởng của những thay đổi nucleotide cũng như amino acid mà chúng tôi
58
tìm thấy trong nghiên cứu này nhưng để đảm bảo độ chính xác cho các nghiên tiếp theo chúng tôi sẽ sử dụng đoạn cDNA của gen FIX ở dòng plasmid tái tổ hợp p19
làm nguyên liệu khởi đầu cho việc biểu hiện cDNA/FIX.
NM_000133 ATGCAGCGCGTGAACATGATCATGGCAGAATCACCAGGCCTCATCACCATCTGCCTTTTA 60 M Q R V N M I M A E S P G L I T I C L L p18 .......................................................C.... 60 P p19 ............................................................ 60 p22 ............................................................ 60 NM_000133 GGATATCTACTCAGTGCTGAATGTACAGTTTTTCTTGATCATGAAAACGCCAACAAAATT 120 G Y L L S A E C T V F L D H E N A N K I p18 ......................................................... 120 p19 ......................................................... 120 p22 ......................................................... 120 NM_000133 CTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTT 180 L N R P K R Y N S G K L E E F V Q G N L p18 ........................................................ 180 p19 ........................................................ 180 p22 ........................................................ 180 NM_000133 GAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAAC 240 E R E C M E E K C S F E E A R E V F E N p18 ..................................................... 240 p19 ..................................................... 240 p22 ..................................................... 240 NM_000133 ACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAAT 300 T E R T T E F W K Q Y V D G D Q C E S N p18 ..................................................... 300 p19 ..................................................... 300 p22 ..................................................... 300 NM_000133 CCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCC 360 P C L N G G S C K D D I N S Y E C W C P p18 .................................................... 360 p19 .................................................... 360 p22 .................................................... 360 NM_000133 TTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGA 420 F G F E G K N C E L D V T C N I K N G R p18 .......................................................... 420 p19 .......................................................... 420 p22 ...................................................C...... 420 NM_000133 TGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGA 480 C E Q F C K N S A D N K V V C S C T E G p18 ................................................ 480 p19 ................................................ 480 p22 ................................................ 480 NM_000133 TATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGA 540 Y R L A E N Q K S C E P A V P F P C G R p18 .......................................................... 540 p19 .......................................................... 540 p22 .......................................................... 540
59 NM_000133 GTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGAC 600 V S V S Q T S K L T R A E T V F P D V D p18 .................................................... 600 p19 .................................................... 600 p22 .................................................... 600 NM_000133 TATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCA 660
Y V N S T E A E T I L D N I T Q S T Q S p18 .......G................................................. 660 S p19 ......................................................... 660 p22 ......................................................... 660 NM_000133 TTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGG 720 F N D F T R V V G G E D A K P G Q F P W p18 .................................................. 720 p19 .................................................. 720 p22 .................................................. 720 NM_000133 CAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAA 780 Q V V L N G K V D A F C G G S I V N E K p18 ................................................. 780 p19 ................................................. 780 p22 ................................................. 780 NM_000133 TGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGT 840 W I V T A A H C V E T G V K I T V V A G p18 .................................................. 840 p19 .................................................. 840 p22 .................................................. 840 NM_000133 GAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATT 900 E H N I E E T E H T E Q K R N V I R I I p18 ............................................................ 900 p19 ............................................................ 900 p22 ............................................................ 900 NM_000133 CCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAA 960 P H H N Y N A A I N K Y N H D I A L L E p18 ............................................................ 960 p19 ............................................................ 960 p22 ............................................................ 960 NM_000133 CTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAA 1020 L D E P L V L N S Y V T P I C I A D K E p18 ............................................................ 1020 p19 ............................................................ 1020 p22 ............................................................ 1020 NM_000133 TACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTC 1080 Y T N I F L K F G S G Y V S G W G R V F p18 ........................................................ 1080 p19 ........................................................ 1080 p22 .....................................................C.. 1080 L NM_000133 CACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCC 1140 H K G R S A L V L Q Y L R V P L V D R A p18 ...................C..................................... 1140 p19 ......................................................... 1140 p22 ......................................................... 1140
60 NM_000133 ACATGTCTTCGATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCAT 1200 T C L R S T K F T I Y N N M F C A G F H p18 ............................................................ 1200 p19 ............................................................ 1200 p22 ............................................................ 1200 NM_000133 GAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAA 1260 E G G R D S C Q G D S G G P H V T E V E p18 ........................................................ 1260 p19 ........................................................ 1260 p22 ........................................................ 1260 NM_000133 GGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAA 1320 G T S F L T G I I S W G E E C A M K G K p18 .................................C...............G...... 1320 p19 ...................................................... 1320 p22 ...................................................... 1320 NM_000133 TATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTC 1380 Y G I Y T K V S R Y V N W I K E K T K L p18 ....................................................T.... 1380 M p19 ......................................................... 1380 p22 ....................G.................................... 1380 NM_000133 ACTTAA 1386 T * p18 ...... 1386 p19 ...... 1386 p22 ...... 1386
Hình 22. So sánh trình tự nucleotide và amino acid suy diễn của các dòng plasmid mang cDNA mã hóa protein FIX ở người và trình tự đã công bố.