LỜI CAM ĐOANTôi xin cam đoan luận án tiến sĩ ngành Hóa sinh học, với đề tài “Nghiên cứu các gene methylketone synthase 2 MKS2 ở cây ca tím Solanum melongena” làcông trình khoa học do Tôi
Trang 1ĐẠI HỌC QUOC GIA THÀNH PHO HO CHÍ MINH
TRUONG DAI HOC KHOA HOC TU NHIEN
Trang 2ĐẠI HỌC QUOC GIA THÀNH PHO HO CHÍ MINH
TRUONG DAI HOC KHOA HOC TU NHIEN
ex
KHUAT LE UYEN VY
NGHIEN CUU CAC GENE METHYLKETONE SYNTHASE 2
(MKS2) O CAY CA TIM Solanum melongena
Ngành: HOA SINH HOC
Mã số ngành: 62 42 01 16
Phản biện 1: PGS.TS Nguyễn Bảo Quốc
Phản biện 2: PGS.TS Nguyễn Phương Thảo
Phản biện 3: TS Phan Tường Lộc
Phản biện độc lập 1: GS.TS Dương Tan Nhựt Phản biện độc lập 2: PGS.TS Nguyễn Bảo Quốc
NGƯỜI HƯỚNG DẪN KHOA HỌC
1 TS NGUYEN THỊ HONG THƯƠNG
2 PGS.TS PHAM THỊ ANH HONG
TP Hồ Chí Minh — Năm 2023
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận án tiến sĩ ngành Hóa sinh học, với đề tài “Nghiên cứu
các gene methylketone synthase 2 (MKS2) ở cây ca tím Solanum melongena” làcông trình khoa học do Tôi thực hiện dưới sự hướng dẫn của TS Nguyễn Thị Hong
Thuong và PGS.TS Pham Thị Anh Hồng
Những kết quả nghiên cứu của luận án hoàn toàn trung thực, chính xác vàkhông trùng lắp với các công trình đã công bồ trong và ngoài nước
Nghiên cứu sinh
KHUAT LÊ UYÊN VY
Trang 4LỜI CẢM ƠN
Trong suốt khoảng thời thực hiện luận án Tiến sĩ, sự hướng dẫn, sự giúp đỡ, sựquan tâm và sự động viên mà tôi nhận được là không thé nao ké hết Bằng tat cả sựtrân quý, tôi xin gửi lời cảm ơn chân thành và sâu sắc đến:
TS Nguyễn Thị Hồng Thương - Cô vừa là một người “Thầy”, vừa là một
người “Chị” luôn đồng hành cùng tôi từ nghiên cứu khoa học cho đến các van dé
trong công việc và cuộc song Nhận được sự hướng dẫn của Cô là một điều may
mắn cho tôi Bên cạnh Cô, tôi “trưởng thành” từng ngày “Tôi của ngày hôm nay”
có sự tiến bộ vượt bậc so với “tôi của lúc trước khi gặp Cô” trong phương pháp
nghiên cứu, trong cách phân tích - đánh giá - biện luận và giải quyết giải van dé
PGS.TS Pham Thị Ánh Hồng — người đã đặt những viên gạch đầu tiên trêncon đường nghiên cứu của tôi Cô là giáo viên hướng dẫn của tôi từ khóa luận tốtnghiệp Đại học, luận văn Thạc sĩ và đến bây giờ là luận án Tiến sĩ Cô luôn quantâm, lo lắng, chỉ bảo và định hướng cho tôi trong nhiều vấn đề, không chỉ là nghiên
cứu khoa học Hơn nữa, Cô cũng là người dẫn dắt tôi đến với Bộ Môn Sinh Hóa,
đến với sự nghiệp giảng dạy, để hôm nay tôi được đứng trên bục giảng và truyền đạtlại những kiến thức, những kinh nghiệm mà tôi đã được học hỏi từ Cô
Các Thay, Cô trong hội đồng báo cáo đề cương, chuyên dé, hội đồng cấp đơn
vị chuyên môn, hội đồng cấp cơ sở đào tạo, phản biện độc lập (PGS.TS Bùi Văn
Lệ, PGS.TS Nguyễn Tiến Thắng, PGS.TS Hồ Huỳnh Thùy Dương, GS.TS.Dương Tấn Nhựt, GS.TS Lê Huyền Ái Thúy, PGS.TS Nguyễn Bảo Quốc,
PGS.TS Nguyễn Phương Thảo, PGS.TS Ngô Đại Nghiệp, TS Nguyễn Vũ
Phong, TS Phan Tường Lộc, TS Phạm Quốc An, TS Nguyễn Dương Tâm
Anh, TS Nguyễn Hoàng Khuê Tú) đã có những góp ý quý báu giúp luận án này
ngày một hoàn thiện hon.
Tập thể nhóm nghiên cứu HTG — mọi người đã luôn chia sẻ và giúp đỡ tôi
trong quá trình nghiên cứu và thực hiện các thí nghiệm Cảm ơn các bạn Sinh viêntôi đã từng hướng dẫn vì tôi đã học hỏi được nhiều điều tốt đẹp từ các bạn!
ii
Trang 5Các Thầy, Cô, Anh, Chị, Em đồng nghiệp trong Bộ Môn Sinh Hóa - nơitôi đã, đang và sẽ gang bó dé học tập và làm việc Tôi luôn nhận được sự quan tâm,
chia sẻ, và động viên của tất cả các thành viên trong Bộ môn — những người luôn
dành sự ưu tiên cho tôi để tôi có thé hoàn thành luận án này
Những điều tốt đẹp nhất luôn được dành lại sau cùng, đó chính là Gia Đình
của tôi (Ba Mẹ tôi, Chồng tôi và các con của tôi) Cảm ơn vì Gia Đình luôn là nơi
dé trở về sau những lo toan vất vả Cảm ơn sự yêu thương và hy sinh mà Ba Me vaNgười bạn đời đã dành cho tôi Cảm ơn Anh vì đã luôn thấu hiểu, cảm thông, ủng
hộ và luôn luôn đồng hành cùng tôi mọi lúc, mọi nơi Cảm ơn sự hiện diện của cáccon Cảm ơn sự đáng yêu của các con đã giúp tôi vượt qua được những thời điểm
khó khăn!
Một lân nữa xin được gửi lời cảm ơn chân thành nhât dén tat ca!
11
Trang 6DANH MỤC HINH ccscscsssscssssesesssscscsecssscssscscsesucsssesscscsesesesssscseescseseeecseaees xiv
CHƯƠNG 1: MO ĐẦU - 5< 5< 5< ss£EsSEssEssErsEvseEsersertsrrssrserssrrsrrssrssree 11.1 Đặt vấn đề - s- + 2T Tx211211 1111211211 1111111211011 11112.11 0111 care 1
1.2 Mục tiêu của đề tai c eeceecccccccsssessessssssesssessesssecssecsusssecssecsuecsesssecssecsusssecssecsnseseceses 2
1.2.1 Mục tiêu tong quát ¿- 2c ©22+E2+EEEEEEEEE211211271111211211111121 211 1xx 2
1.2.2 Mục tiêu CU thỂ ¿52-56222221 2E1E212112112112717112112111111211 21.1 21.3 Nội dung của đề tài ¿5c St SE k EEE121211111 1171121121111 21 1111111 Eagye 21.4 Ý nghĩa khoa học của đề tài 5-25- 5222x222 2212212112211 31.5 Ý nghĩa thực tiễn của đề tài ¿ 5-2sc 5c 22x 2223221221211 4
CHƯƠNG 2: TONG QUAN TÀI LIỆU -5- 5-5 << ssess5ssesessssessesse 6
2.1 Cà tím Solanum MelOngend Sà 319v v1 kg ng kg 6
2.1.1 Phân loại khoa học và nguồn gốc của loài Solanum melongena L 6
2.1.2 Cơ sở dữ liệu bộ gene của ca tím S zn0eÏongef€d «+ cc<scss+se+s 72.2 Methylketone synthase 2 tham gia chính trong con đường sinh tổng hợp 2-
methylketone ở cà chua dai S$ habÐrOCÏ@If€S à.à Sàc cà siitsirrrrreeresrrree 8
2.3 Hệ gene methylketone synthase 2 ở thực vVật Ặ.Ă Sky 12
2.4 Sự đa dạng trong hoạt tính xúc tác in vivo của các MKS2 từ thực vật 132.5 Methylketone synthase 2 là acyl-ACP thioesterase có cau trúc gấp cuộn kiểu
Mi 0n 000i: 011 0 3ĂẼ 162.6 Hợp chất 2-methylketone và tiềm năng ứng dụng -¿-5¿5¿+: 20
2.6.1 Giới thiệu về hợp chất methylketone - 2 2 s2 +2+£+£z+£+rxzseez 20
2.6.2 Vai trò của 2-methylketone ở thực Vat -c cSĂSsssSsssirsesresee 21
iv
Trang 72.6.3 Một số ứng dung của methylketone trong đời sống -: 21
2.6.3.1 Tạo hương cho thực phẩm va mỹ phẩm 2 5 + 55¿¿ 21
2.6.3.2 Ung dụng tiềm năng của 2-methylketone trong sản xuất năng lượng
Ôn 22
2.7 Tổng hop 2-methylketone - Thách thức và cơ hội - 2 ¿5z s+zszss 23
2.7.1 Tổng hợp 2-methylketone bang con đường hóa học - - 232.7.2 Sinh tổng hợp 2-methylketone ở thực Vat - 2 2 z+szxerzrsses 242.7.3 Ứng dụng nguồn gene MKS2 từ thực vật trong sinh tông hợp 2-
methylketone bằng kỹ thuật biến biến dưỡng vi sinh vật - 24
2.8 Con đường truyền tín hiệu phòng vệ ở thực vật -2- + secxzce+z 28
2.9 Vai trò của yếu tố điều hòa cis trong điều hòa hoạt động gene 31
2.10 Các thuật ngữ cơ bản liên quan cơ sở đữ liệu trình tự . -«<s- 33
CHƯƠNG 3: ĐÓI TƯỢNG, VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN
10100577 373.1 Đối tượng và vật liệu nghiên cứu - 2 2 s+x++E£+E++EE£EEerEezresrxerxerree 37
3.1.1 Đối tượng nghiên cứu - 2 2 x+2E++E2EESEEEEEEEEE2E1E171211 11T crxeeU 37
3.1.2 Vật liệu nghiÊn CỨU - - G c 3319911891119 31 19 1 1 11 1 ng ng ng kg 37
3.1.2.1 Cây cà tím (S melongena ÌU.) c «+ S<s+sskisssesseeeeseressers 37
3.1.2.2 CẨOT - Gv H H r 37
3.1.2.3 Chủng E coli C41(DEE3) - Ác St SnH HH HH HH, 39
3.2 Phương pháp nghiên CỨU - - G2 33193 291191119111 1 11H ng ng ng rệt 40
3.2.1 Dự đoán số lượng và cấu trúc của các gene MKS2 ở cà tím
S MELON GONG 8n n 403.2.2 Tach chiết RNA tổng số va DNA bộ gene của ca tim S melongena 42
3.2.2.1 Tach chiết RNA tổng 86 escccscssscsssesssesssssssessecssessesssecssecsuscseessecaseess 42
3.2.3.2 Tach chiết DNA bộ gene ceecesscescessessesssessessessesssessessessessesseeseesees 42
3.2.3 Tổng hop cDNA tit RNA tổng SỐ ececesseessessesseessessessesseessessessessessesseesess 433.2.4 Thiết kế mỗi cho phan ứng PCR 2-2-2 £+S£2EE+EE+EE2EEzEEerxerreee 43
3.2.4.1 Nguyên tắc chung trong thiết kế mỖi - 2 + 5z s+cs+ss2 43
Trang 83.2.4.2 Thiết kế mỗi dùng dé phân lập các trình tự mã hóa protein
SmMKS2 (CDS_ SmM K S2) - S5 St rey 43
3.2.4.3 Thiết kế mỗi dùng dé nhân bản và giải mã trình tự các gene
M7600 7220 ẺnẺe Ầ.ẦẦẦẦ< 44
3.2.5 Phân lập các CDS_SmMKS2 và gSmMKS2 bang kỹ thuật PCR 44
3.2.6 Cau trúc các plasmid tái tổ hợp pJET1.2-SmMKS2-1, pJET1.2-SmMKS2-2
Va PJET1.2-SIMKS2-3 473.2.7 Thiết kế phan ứng RT-qPCR o ceccccsessessssssessessesssessessessessssssessessessesseesessess 48
3.2.7.1 Thanh phan và chu trình nhiệt của phản ứng RT-qPCR 48
3.2.7.2 Lựa chọn gene tham ChiẾU 52c tt 2EEEEEEEEEEEEEEEEkrkrrkererree 48
3.2.7.3 Thiết kế mỗi sử dụng trong phản ứng RT-qPCR - 493.2.7.4 Khảo sát nhiệt độ gắn môi trong phan ứng RT-qPCR 493.2.7.5 Khảo sát hiệu suất nhân bản của các phản ứng RT-qPCR 513.2.7.6 Định lượng tương đối mức độ biéu hiện của các gene mục tiêu
3.2.8 Khao sát mức độ biểu hiện phiên mã của các gene SnmMKS2 ở các mô
khác nhau của cây cà tím S rm€ÏOHB€Hđ - c5 SS< + +seksseersseeree 523.2.9 Khao sát sự biểu hiện phiên mã của các gene SmMKS2 trong đáp ứng với
các tín hiệu căng thắng ¿2:22 2+22E+2EE2EEE2EEEEE2EE2EEEEerkrrrrees 53
3.2.10 Phan tích hoạt tính xúc tác in vivo của các protein sSmMKS2 54
3.2.10.1 Cau trúc plasmid tái tổ hợp pETDuet- I-sSmwMKS2- 1/2/3 54
3.2.10.2 Cau trúc plasmid tái tổ hợp pETDuet-1-sSmMKS2-2-D77E 58
3.2.10.3 Cam ứng biéu hiện protein SmMKS2 trong tế bao E coli
0® 3009-0107 593.2.10.4 Kiểm tra sự biểu hiện của protein SmMKS2 trong tế bao E coli
C41(DE3) bằng phương pháp SDS-PAGE 5+: 60
3.2.10.5 Phân tích hoạt tính enzyme in vivo của protein SnMKS2 thông
qua phân tích thành phần Ø-ketoacid trong dịch nuôi cấy 60
3.2.11 Công cụ tin-sinh học được sử dụng trong nghiên cứu - 62
vi
Trang 9CHƯƠNG 4: KET QQU Ả 5-5 5° 5° s9 se E9 seEeEsevesersesersersree 644.1 Phân lập và xác định cau trúc exon-intron của các gene mã hóa protein tương
đồng với methylketone synthase 2 từ cà tím S melongena -. - 644.1.1 Dự đoán số lượng gene mã hóa protein tương đồng với protein ShMKS2 ở
CA THM 0990//72/2/742/.2000nn8nẺ8n88 644.1.2 Phân lập, giải mã trình tự và xác định cấu trúc gene ŠuMKS2-1 67
4.1.2.1 Dự đoán trình tự và cau tric gene SnMKS2-1 bằng công cụ tin-sinh
4.1.2.2 Phân lập và giải mã trình tự mã hóa SmMKS2-1 (CDS_SmMKS2-T)
từ cả tím S 7!ÏOTICTI( cư, 69 4.1.2.3 Phan lập và giải mã trình tự gene SnMKS2-1 (gSmMKS2-1) từ cà
tím Š 0€ÏO'Đ€T( - sgk, 714.1.3 Phan lập, giải mã trình tự va xác định cau trúc gene SmMKS2-2 75
4.1.3.1 Dự đoán trình tự và cấu trúc gene SmMKS2-2 bằng công cụ tin-sinh
4.1.3.2 Phân lập và giải mã trình tự mã hóa SmMKS2-2 (CDS_SmMKS2-2)
từ cả tím S 712ÏOTIĐCH( cv Hư, 81 4.1.3.3 Phân lập và giải mã trình tự gene SmMKS2-2 (gSmMKS2-2) từ cà
tím S €ÏOHĐ€H( 5 HH ni, 84
4.1.4 Phân lập, giải mã trình tự và xác định cấu trúc gene SrnmMKS2-3 87
4.1.4.1 Dự đoán trình tự va cấu trúc gene SnMKS2-3 bằng công cụ tin-sinh
4.1.4.2 Phân lập và giải mã trình tự mã hóa SmMKS2-3 (CDS_SmMKS2-3)
từ cà tím S ?0€ÏOFIĐ€H(( - 5 5 tk tr, 90 4.1.4.3 Phân lập và giải mã trình tự gene SmMKS2-3 (gSmMKS2-3) từ cà
ti S //72/2/712/.2000ẺẼẺẼ588aẢ Ả 934.2 Phân tích một số đặc điểm điều hòa phiên mã của các gene SmMKS2 ở cà tím S
//1410/142//7PPEERESSSEAE.aA , 954.2.1 Khao sát nhiệt độ gắn môi trong phan ứng RT-qPCR - 95
vii
Trang 104.2.2 Xác định hiệu suất của các phan ứng RT-qPCR - 55+ 964.2.3 Biểu hiện phiên mã của gene SmAPRT ở cà tím S melongena 974.2.4 Phân tích sự biểu hiện phiên mã của gene SnMKS2-1, SmMKS2-2 và
SmMKS2-3 ở các mô khác nhau của cà tím S melongena 99
4.2.5 Phân tích sự biểu hiện phiên mã của các gene SnMKS2-1, SmMKS2-2 và
SmMKS2-3 trong đáp ứng với các tín hiệu căng thăng - 1014.2.6 Yếu tố điều hòa cis liên quan đến các đáp ứng căng thăng của thực vật hiện
diện trên vùng khởi động phiên mã của các gene SmMKS2-1/273 103 4.3 Phân tích hoạt tính xúc tác in vivo của các protein sSmMKS2-1, ssmMKS2-2 và
4.3.3 Chức năng xúc tác in vivo của sSmMKS2-1, sSmMKS2-2 và sSmMKS2-3
thé hiện qua thành phan Ø-ketoacid tích lũy trong dịch nuôi cấy chủng E
coli C41(DE3) được cảm ứng biểu hiện các protein này - 1144.3.4 Phân tích vai trò của aspartate bảo tồn đối với sự thê hiện hoạt tính
thioesterase của protein sSmMIKS2-2 - xnxx rrrkt 119CHƯƠNG 5: THẢO LUẬN 2-2 s<©ss©ssssevseEssEsstvserserssrserssrrsrrssre 123
5.1 Sự tiễn hóa phân kỳ (divergent evolution) đã diễn ra với nhóm gene MKS2/ALT
ở nhiều loài thực vật, bao gồm cà tím Š melongena -: z zc-z-: 123
5.2 Sự khác biệt trong mô hình biéu hiện phiên mã của ba gene SnMKS2-1,
SMmMKS2-2 Va SMMKS2-3 0nẺnhh 1265.3 Sự tương quan giữa hoạt tính xúc tac in vivo trong hệ thống biéu hiện E coli với
hoạt tính xúc tác in planta của các acyl-ACP thioesterase từ thực vật 128
5.4 Hoạt tính xúc tac in vivo của sSmMKS2-1, sSmMKS2-2 và sSmMKS2-3 130
5.5 Khi được biểu hiện trong E coli, sSmMKS2-1 tạo ra phô sản phẩm đa dang hơn
Xu 6217 4-4 135
viii
Trang 115.6 Khi được biéu hiện trong E coli, sSmMKS2-1 và ssmMKS2-2 đều tạo ra sản
phẩm chính là /-ketoacid 1⁄4: Ì c2 ©s+SEEE+EE+E+E££E£EEEEEEEEEEkEEkrrerrrree 140
CHUONG 6: KET LUẬN VÀ KIÊN NGHỊ 2 -s-cs<ssssesssesses 144384.50 Ả ố.ốố.ốố 144
6.2 Kiến nghị - ¿56 Sc tt 1E11211211211211 1111111111111 11 1111111111111 re 144
DANH MỤC CÔNG TRÌNH CONG BO CUA TÁC GIÁ LIÊN QUAN DEN
LUẬN ÁN 25c s22 2 21221221211211211011211211.11 0111.11.1111 146DANH MỤC TÀI LIEU THAM KHẢO - 2- 2 + x+2£++EE+£Evrxzxezrsrred 147
PHU LỤC 2-22 2E22EE22EE221127112112711711271211711211211111.11 1111k 163
1X
Trang 12DANH MỤC CHỮ VIET TAT
4HBT 4-Hydroxybenzoyl-CoA thioesterase
ACP Acyl carrier protein
ALT Acyl-lipid thioesterase
APS Ammonium persulfate
BLAST Basic local alignment search tool (công cụ so sánh trình tự
truy vấn
bp Base palr
cDNA Complementary deoxyribonucleic acid
CDS Coding sequence (trình tự mã hóa)
CRE cis-regulatory elements (yếu tô điều hòa cis)
Ct Threshold cycle (chu ky ngưỡng trong phản ứng qPCR)
DNA Deoxyribonucleic acid
dNTP Deoxynucleotide triphosphate
E% PCR efficiency (hiệu suất nhân bản của phan ứng qPCR)
EDTA Ethylenediaminetetraacetic Acid
EST Expressed sequence tag (trình tự biểu hiện)
MCS Multiple cloning site (vùng tao dong)
MeJA Methyl jasmonate
MeSA Methyl salicylate
MKSI Methylketone synthase 1
MKS2 Methylketone synthase 2
mRNA messenger RNA (RNA thông tin)
MS Mass spectrometry (khối phổ)
Trang 13Polymerase chain reaction
Reverse transcription — quantitative polymerase chain reaction
Ribonucleic acidRetention time (thời gian lưu trong sắc ky GC-FID va GC-MS)Salicylic acid
Sodium dodecyl sulfate
Sodium dodecyl sulfate-polyacrylamide gel electrophoresis
Protein SmMKS2 hoàn chỉnh (bao gồm trình tự peptide
vận chuyền)
của cà tím Solanum melongenaProtein SmMKS2 trưởng thành (không bao gồm trình tự peptidevận chuyên) của cà tím Solanum melongena
trình tự gene SmMKS2 của cà tím Solanum melongena Tris-Acetate-EDTA
TetramethylethylenediamineMelting temperature (nhiệt độ nóng chảy của môi trong PCR)Annealing temperature (nhiệt độ bắt cặp của môi trong PCR)
xi
Trang 14DANH MỤC BANG
Bang 3.1 Thanh phần của phản ứng tông hợp eDNA - 2 25c s+cx+csezszse2 43Bảng 3.2 Trình tự mỗi xuôi và mỗi ngược dùng dé nhân ban các CDS_SmMKS2 44Bảng 3.3 Trình tự môi xuôi và môi ngược dùng đê nhân bản các phân đoạn trong
trình tu genomic của các gene ,5+M[K/Š2 - ss + ccs + v vn n r rưy 45
Bảng 3.4 Thành phan của phan ứng PCR ¿5c 2S SE£EE+E2E££EerEerkerxerxree 46
Bảng 3.5 Chu trình nhiệt của phản ứng PCR - «+ *sxEsesveesersrserske 46Bảng 3.6 Nhiệt độ bắt cặp Ta và thời gian kéo dai trong các phản ứng PCR 46Bảng 3.7 Thành phan phản ứng RT-qPCR - 2-22 5¿22+2£+2x+2£xzzxezxesrxz 48
Bảng 3.8 Chu trình nhiệt của phan ứng RT-gqPCTR - 5555 cs+<*s+sssexssersss 48Bang 3.9 Trình tự mỗi xuôi va mỗi ngược dùng dùng trong các phan ứng RT-qPCR
— ố.ố.ố.ố.Ố 50
Bang 3.10 Trình tự mỗi xuôi và mỗi ngược dùng dé nhân bản các phân đoạn
sSmMKS2-1/2/3 chứa trình tự nhận biết Ndel ở đầu 5° và Xhol ở đầu 3' 55Bảng 3.11 Thành phan của phản ứng PCR nhân bản các phân đoạn sSmMKS2-1/2/3chứa trình tự nhận biết Ndel ở đầu 5° và Xhol ở đầu 3' cccccccrre 56
Bảng 3.12 Chu trình nhiệt của phản ứng PCR nhân bản các phân đoạn
sSmMKS2-1/2/3 chứa trình tự nhận biết NdeI ở đầu 5° và Xhol ở đầu 3' -. 56Bảng 3.13 Nhiệt độ bắt cặp Ta và thời gian kéo đài trong các phan ứng PCR 56Bang 3.14 Thanh phan phản ứng cắt plasmid pJET1.2-sSmMKS2-1/2/3 và vector
pETDuet-1 bang enzyme cắt giới han NdeI và XNOM o ceccesscsscsssessesssesesseeseesesseeseees 57Bang 3.15 Thanh phan phản ứng nối sSmMKS2-1/2/3 có đầu dính 5’-Ndel và 3’-
Bang 4.1 Mã số truy cập trong cơ sở dit liệu bộ gene cà tím S melongena và tên gọiquy ước của các gene SMMKS2 giả Ginh - 5 s11 HH gi, 66
Bảng 4.2 Giá tri chu kỳ ngưỡng (Ct) trong phan ứng RT-qPCR khi sử dụng các
nhiệt độ gắn mồi (Ta) khác nhau - ¿2 2£ +E£2EE2EE+EE+EE£2EE+EE+EEtzEEzEEzrxerxerez 96Bảng 4.3 Giá tri chu kỳ ngưỡng C: trong phản ứng RT-qPCR khảo sát biểu hiện củagene SmAPRT ở các mô khác nhau của cây cà tím S rmelongena 98
Xil
Trang 15Bang 4.4 Giá tri chu kỳ ngưỡng C: trong phản ứng RT-qPCR khảo sát biểu hiện củagene SmAPRT ở cây cà tím S melongena trong thí nghiệm xử lý gây vết thương cơ
học, xử lý MeJA và xử lý MeSA -.L ScLn HH HH TH TH TH HH TH tr 99
Bảng 4.5 Giá trị chu kỳ ngưỡng (Ct) của phan ứng RT-qPCR phân tích sự biểu hiện
phiên mã của gene SmMKS2-1, SnMKS2-2 và SmMKS2-3 ở các mô khác nhau của
M2 100Bang 4.6 Giá trị chu kỳ ngưỡng (Ct) của phan ứng RT-qPCR phân tích sự biểu hiện
phiên mã của các gene SnMKS2-1 và SmMKS2-2 trong dap ứng với các tín hiệu
ni 102
Bảng 4.7 Các yếu tố điều hòa cis (CRE) hiện diện trên vùng khởi động phiên mã
của các gene ,S7/1MI K Š52- Ï/22/2) «cv vn HH kg ệp 106Bảng 4.8 Kết quả định lượng các f-ketoacid tích lũy trong dich nuôi cấy chủng E
coli C41(DE3) biểu hiện sSmMKS2-1 hoặc sSmMMKS2-2 - 55x52 118Bảng 5.1 Mức độ tương đồng của các protein SmMKS2 với các protein
¡627.0508711 ằ ai 123
xiii
Trang 16DANH MỤC HÌNH
Hình 2.1 Cây cà tím S melongena dòng thuần được sử dụng trong nghiên cứu 6Hình 2.2 Hai phản ứng cuối trong con đường sinh tổng hợp 2-methylketone 10Hình 2.3 Con đường sinh tổng hop acid béo ở thực vật -¿- 2 s+sz=sz 11
Hình 2.4 Cấu trúc gấp cuộn “hot-dog” đơn của 1Z54 (màu tím) xếp chồng lên cầu
trúc PS4HBT (màu xanh) 5 1 1112111111111 111111 1111111118111 1181111118111 tr 19Hình 2.5 Cấu trúc của phức hợp enzyme-co chất 2CYE-CoA (màu vàng) xếp chồnglên cau trúc của phức hợp Ps4HBT- 4-hydroxybenzoyl-CoA (màu xanh) 19Hình 2.6 Một số dạng 2-methylketone mạch thăng trong tự nhiên 20Hình 2.7 Con đường sinh tổng hợp 2-methylketone từ glucose trong tế bào E coli
biểu hiện hai gene S$JMKS1 và ,ShMKS2 -©22©525<+EE‡EEEEE2EEEEEerErrkrrkerkrres 26Hình 2.8 Con đường truyền tín hiệu phòng vệ phụ thuộc SA (a) và JA (b) ở thực vật
— 31
Hình 2.9 Sơ đồ vùng kiểm soát/điều hòa hoạt động gene và cách thức điều hòa
09000 N3 NA - 32
Hình 2.10 Cách thức xây dựng dữ liệu EST - ác Sssserersrerrek 34
Hình 2.11 Sự lắp ráp các phân đoạn DNA thành contig va scaffold 35Hình 3.1 Cấu trúc vector pJE7T1.2/bluntL + ¿5 s+SE££+E£+E+zE££kerkerxerxerssree 38Hình 3.2 Cấu trúc vector pETTDuet- 2¿ ¿2£ x+2E+£E£EE+EEerxerkerrxerkerkrex 39
Hình 3.3 Giao diện tra cứu co sở dữ liệu bộ gene S melongena
(http://eggplant.kazusa.or.jp/blast.html) với trình tự truy van là ShMKS2 và công cụ
truy Van 20.350) 080 5a ớ:.A Al
Hình 3.4 Cây cà tím 13 tuần tuổi được sử dung dé thu các mẫu mô lá non, lá trưởng
thành, thân, rễ, hoa Va quả - - 2 - 2 SE £SE9EE2E£EE£EEEEEEEEEEEEEEEEEEEEEEEEEEE 1E Eerrrei 52
Hình 3.5 Thí nghiệm mô phỏng cây cà tím chịu tác động của các tác nhân gây căng
Hình 4.1 Kết quả TBLASTN cơ sở dit liệu bộ gene của cà tím S melongena với
trình tự truy vẫn ShMIKS2 - + StS<SE2E12121212111211111121121E 011111111 ty 65
XIV
Trang 17Hình 4.2 Kết quả TBLASTN cơ sở dit liệu CDS của cà tím S melongena với trình
tự truy vấn ShIMIKS2 ¿5c St SềExỀEEE121121121111111111111111 1111111111 1 cte 66
Hình 4.3 Trình tự các CDS Sme2.5_06004.1_g¢00003.1, Sme2.5_20884.1_ g00002.1
và Sme2.5_02928.1_øg00002.1 mã hóa các protein tương đồng với ShMKS2 được
ghi nhận từ cơ sở dữ liệu CDS của S m£ÏOH€Hđ S.c S25 ssiseikserxeerssersres 67
Hình 4.4 Cấu trúc gene SmMKS2-1 theo phân tích in silico và trình tự amino acid
của protein giả định mã hóa bởi gene SMMKS2-1 - «se kksvkseksseksseesvee 69Hình 4.5 Kết quả điện di sản phẩm của phan ứng PCR nhân bản CDS_SmMKS2-1
và sản phẩm của phản ứng PCR khuẩn lạc sàng lọc dòng tế bào E coli
TOPIO/pJET1.2-SMMKS2-1 eee 70
Hình 4.6 Trình tự nucleotide của CDS_SmMKS2-1 đã dong hóa (A) và trình tự
amino acid cua protein được mã hóa bởi CDS_ SmMKS2-T (B) 71Hình 4.7 Kết quả sắp gióng cột trình tự CDS_SmMKS2-1_in silico và trình tự
CDS_ SmMKS2-T phân lập từ cà tím S$ rmeÏO'IS€Tđ S5 Series 72Hình 4.8 Kết quả điện di sản phẩm của phản ứng PCR nhân bản phân đoạn 1 (A),
phân đoạn 2 (B) va phân đoạn 3 (C) của gSMMKS2-1 ằẶcccSSccseerssereeres 73
Hình 4.9 Trình tự gSmMKS2-1/ phân lập từ DNA bộ gene ca tím S melongena 74
Hình 4.10 Kết quả sắp gióng cột Sme2.5_20884.1_ g00002.1 với các CDS mã hóa
protein ShMKS2, SIMKS2a, SIMKS2b và SIMKS2c từ hai loài cà chua thuộc chi
SOLANUIMN 80P0ẼnẼẺeA d 78Hình 4.11 Kết quả dự đoán trình tự mã hóa protein SmMKS2-2 trưởng thành
Hình 4.12 Kết quả sap gióng cột trình tự protein SmMKS2-2 trưởng thành
(sSmMKS2-2) từ cà tím S melongena với các protein MKS2 hoàn chỉnh từ hai loài
CA Chua thuGc Chi SOLANUIMN PB Ea 79Hình 4.13 Kết quả sắp gióng cột CDS_sSmMKS2-2_in silico với trình tự khung đọc
mở dự đoán trên “hit” trình tự có mã số truy cập GEZT01051720.1 S0Hình 4.14 Kết quả sắp gióng cột trình tự SmMKS2-2_in silico và trình tự protein
mã hóa bởi GEZT01051720.1 ORRE - 5 2c 512319319911 11 1 HH HH ng nưệt 81
XV
Trang 18Hình 4.15 Kết quả điện di sản phẩm của phản ứng PCR nhân bản CDS_SmMKS2-2
và sản phẩm của phản ứng PCR khuẩn lạc sàng lọc dong tế bào E coli
I9)10/9/5005230)/0 67721 82
Hình 4.16 Trình tự CDS_SmMKS2-2 đã dòng hóa (A) và trình tự protein được mã
hoa 00990 N}//7// 6⁄27 ẺẼẺ58.® 83
Hình 4.17 Kết quả sắp gióng cột trình tự CDS_sSmMKS2-2_in silico và trình tự
CDS_ SmMKS2-2 phân lập từ cà tím S$ rm€ÏO'ISGTđ S5 sssisiksskrsvks 84Hình 4.18 Kết quả điện di sản phẩm của phản ứng PCR nhân bản phân đoạn 1 (A),
2 (B) va ÏN(91v 6.3.7 799222 85
Hình 4.19 Trình tự gSmMKS2-2 phân lập từ DNA bộ gene ca tím S melongena 86Hình 4.20 Kết quả sắp gióng cột protein mã hóa từ CDS
Sme2.5_02928.1_g00002.1 và ShMKS2 - - - S- 1k1 HH HH Hy 88Hình 4.21 Kết quả dự đoán sự hiện diện và cau trúc exon-intron của gSmMKS2-3
trên vùng trình tự đối ngược bồ sung của scaffold Sme2.5 02928 L 90
Hình 4.22 Trình tự CDS_SmMKS2-3_in silico (A) và trình tự dự đoán của protein
SmMKS2-3 (SmMKS2-3_in silico) (B) được dịch mã từ CDS_SmMKS2-3_in silico
Hình 4.23 Kết quả điện di sản pham của phản ứng PCR nhân bản CDS_SmMKS2-3
và sản phẩm của phản ứng PCR khuẩn lạc sàng lọc dòng tế bào E coli
I9)310)01)500/20ii)/)0.472 6 4 92
Hình 4.24 Kết quả sắp gióng cột CDS_SmMKS2_in silico và CDS_SmMKS2-3 phân
lập từ cà tím Š MelOn gen -.cSSc nh HH TH HT HH rệt 93 Hình 4.25 Trình tự CDS_SmMKS2-3 đã dòng hóa (A) và trình tự protein SnMKS2-
3 được mã hóa bởi CDS_SMMKS2-3 (B) Q1 1S 1S 11111111 vy 93Hình 4.26 Kết quả điện di sản phẩm của phan ứng PCR nhân bản phân đoạn 1 (A)
\⁄:§0¡ 0t 3810 5)8i 0.2327 0675 94 Hình 4.27 Trình tự gSmMKS2-3 phân lập từ DNA bộ gene cả tím S melongena 95
XVI
Trang 19Hình 4.28 Đồ thi đường chuẩn biểu diễn mối tương quan giữa chu kỳ ngưỡng (Ct)
và nồng độ cDNA khi thực hiện phản ứng RT-qPCR trên gene SmMKS2-1,
SmMKS2-2, SmMKS2-3 và gene tham chiếu SMAPRT vccccccscscscscssscssssssesesesescsvsveveees 97Hình 4.29 Mức độ biéu hiện phiên mã tương đối (R) của gene SnMKS2-1,
SmMKS2-2 và SmMKS2-3 ở các mô khác nhau của S MelOngena 100
Hình 4.30 Mức độ biéu hiện phiên mã tương đối (R) của gene SnMKS2-1 và
SmMKS2-2 trong đáp ứng với các tín hiệu căng thắng -. - 5: ©5z+5<+c5+¿ 102Hình 4.31 Số lượng các CRE hiện diện trong vùng khởi động phiên mã của các
7/8 6/20//220P P000 109
Hình 4.32 Kết quả điện di sản phẩm PCR nhân bản các phân đoạn sSmMKS2-1/ (A),sSmMKS2-2 (B) và sSmMKS2-3 (C) chứa trình tự nhận biết NdeI ở đầu 5° và Xhol ở
Hình 4.33 Kết quả điện di sản phẩm cat plasmid pJET1.2-sSmMKS2-1 (A),
pJET1.2-sSmMKS2-2 (B), và pJET1.2-sSmMKS2-3 (C) bằng Ndel và Xhol 111Hình 4.34 Kết quả phân tích sự biéu hiện của protein SmMKS2-1 trong tế bào E
coli C41(DIE3) 5c 5s 2s 2E 2127122112211271211211 111211 111111 1E eeerree 113Hình 4.35 Kết quả phân tích sự biểu hiện của protein SmMKS2-2 trong tế bào E
21/0911) 50 0087 -1‹- 113Hình 4.36 Kết quả phân tích sự biéu hiện của protein SmMKS2-3 trong tế bào E
1/9:110)550 0757 <4 114
Hình 4.37 Sắc ký đồ mô ta các hợp chất 2-methylketone hiện diện trong dịch nuôi
cấy các chủng E coli C41(DE3) biểu hiện sSmMKS2-1 (2), ssmMKS2-2 (3),
sSmMKS2-3 (4) và chủng EF coli C41(DE3) mang vector pETDuet-1 (5) 116Hình 4.38 Biéu đồ thé hiện hàm lượng Ø-ketoacid tích lũy trong dịch nuôi cấy
chủng E coli C41(DE3) mang vector pETDuet-1 hoặc biểu hiện ssmMKS2-1,
sSmMKS2-2, hoặc SSMMKS2-3 22111311 xxx vn ng 119Hình 4.39 Kết quả phân tích sự biểu hiện của protein đột biến sSmMKS2-2-D77E
trong tế bào E coli C41(DIE3) - ¿52-5 2E EEE9EEEEE211271271711211211 111.1 crxe 120
XVil
Trang 20Hình 4.40 Sắc ký đồ mô tả các hợp chat hiện diện trong dịch nuôi cay chủng E coliC41(DE3) biểu hiện sSmMKS2-2-D77E - 2-5252 ££SE£EE££E£2EE£EEeEErEerrerrxee 121Hình 5.1 Cây tiễn hóa dựa trên so sánh các trình tự mã hóa MKS2/ALT 125
Hình 5.2 Kết quả sắp gióng cột các trình tự protein hoàn chỉnh SmMKS2 với các
protein MKS2/ALT đã được khảo sát chức năng ¿5c c + sssssserssssses 133
Hình 5.3 Hai motif xuất hiện trong các MKS2/ALT ưu tiên cơ chất B-ketoacyl-ACP
và 3-hydroxyacyl-ACP có mạch dai 12-14 carbon - - «+ ++-s£++*se++se+sss2 136Hình 5.4 Vị trí gắn dự đoán của nhóm pantetheine trên sSmMKS2-I và sSmMKS2-
P -(-Õ-5ÖỎÖ3 138
Hình 5.5 Hình dạng túi liên kết chuỗi acyl của sSmMKS2-1/2 và vị trí các amino
acid làm anh hưởng đến hình dạng túi liên kẾt ¿2 2 s2 +2 22252252 139Hình 5.6 MKS2 hoạt động trên các cơ chất trung gian của con đường chuyền hóa
ACIC DEO OE COL 1n 142
XVill
Trang 21CHƯƠNG 1
MO DAU
Trang 22CHƯƠNG 1: MỞ ĐẦU
1.1 Đặt van đề
Methylketone synthase 2 (MKS2), hay còn được gọi là acyl-lipid
thioesterase (ALT) được xác định lần đầu tiên ở loài cà chua dai Solanum
habrochaites subsp glabratum MKS2 là enzyme tham gia trong con đường sinh
tổng hợp 2-methylketone ở lông tiết của cà chua dại [1] 2-Methylketone có tácdụng xua đuổi và tiêu diệt côn trùng [2] MKS2 xúc tác phản ứng thủy phân liên kếtthioester của Ø-ketoacyl-ACP (hợp chất trung gian trong con đường sinh tổng hợp
acid béo) tạo thành f-ketoacid tương ứng Các Ø-ketoacid này dễ dàng được khử
nhóm carboxyl bởi methylketone synthase 1 (MKS1) hoặc nhiệt độ cao trong môi
trường acid dé tạo thành 2-methyketone có chiều dài chuỗi ngắn hơn một nguyên tửcarbon [3] Gần đây, MKS2 hoặc ALT được tìm thấy hiện diện ở nhiều loài thực vậtkhác nhau như cà chua thuần hóa Solanum lycopersicum, Arabidopsis thaliana, đậu
nành Glycine max Khi được biểu hiện ở vi khuẩn Escherichia coli, mỗi
MKS2/ALT có khả năng chuyền hóa acyl-ACP dé tạo ra một hỗ sơ acid béo (fattyacid profile) đặc trưng và không trùng lắp với các MKS2/ALT khác [3-6] Acyl-ACP là những chất trung gian của con đường chuyền hóa acid béo; chúng có khungcarbon đa dạng về chiều dài, mức độ bão hòa và trạng thái oxy hóa [7] Việc pháthiện và phân lập các trình tự gene MKS2/ALT mới từ nhiều loài thực vật khác nhau
sẽ góp phần làm phong phú thêm bộ sưu tập nguồn gene mã hóa các enzymeMKS2, trong đó mỗi enzyme có thể có tính đặc hiệu cơ chất khác nhau
Họ Solanaceae bao gồm nhiều loài cây có vai trò quan trọng trong nôngnghiệp và y học Gần đây, trình tự bộ gene của một số loài trong họ này đã đượcgiải mã, tạo điều kiện thuận lợi cho việc dự đoán và phân lập các gene mới Cây càtím Solanum melongena (thuộc họ Solanaceae) là loài nông sản quan trọng va phổbiến ở các nước Châu Á, Trung Đông, Cận Đông, Dia Trung Hải và Chau Phi Cà
tim được sử dụng dé điều trị một số bệnh như tiêu đường, viêm khớp, hen suyễn vaviêm phế quản [8] Vì hiệu quả biến nạp gene cao, cây cà tím còn được sử dụng làm
cây mô hình đề nghiên cứu các tính trạng nông học khác nhau thông qua công nghệ
Trang 23chuyển gene [9] Hiện tại, cơ sở dữ liệu bộ gene ca tím đã được giải mã tương đối
hoàn chỉnh, với khoảng 35.000 gene được chú thích [10] Đáng lưu ý, cà tím S.
melongena thuộc phan chi Leptostemonum (ca gai) trong ho Solanaceae, khác với
cà chua va khoai tây — thuộc phân chi Potatoe [11] Do đó xét về mặt phat sinh loài,
cà tím khác biệt với những loài khác thuộc họ Solanaceae Các thông tin di truyềncủa cà tím là những dữ liệu quan trọng cho các nghiên cứu so sánh về di truyền,sinh lý học, sự phát triển và tiến hóa của ho Solanaceae Vì vậy, đề tài “Nghiên cứu
các gene methylketone synthase 2 (MKS2) ở cay cà tím Solanum melongena” được
thực hiện nhằm phát hiện và phân tích chức năng của các gene MKS2 ở cà tím, mộtđại diện quan trọng khác của họ Solanaceae Kết quả của đề tài sẽ góp phần làm
sang tỏ hơn vai trò và sự đa dạng của các gene MKS2 ở họ thực vật nay.
1.2 Mục tiêu của đề tài
1.2.1 Mục tiêu tong quát
Thu nhận các thông tin dit liệu về đặc điểm cấu trúc và chức năng của các
gene MKS2 ở cà tím S melongena (ky hiệu SmMKS2).
Khảo sát được chức năng xúc tác f-ketoacyl-ACP thioesterase của các
protein mã hóa bởi các gene SmMKS2 thông qua sự biểu hiện tái t6 hợp trong tế bào
vi khuẩn E coli
1.3 Nội dung của đề tài
Để thực hiện ba mục tiêu cụ thé đã đề ra, luận án được tiến hành với 4 nộidung chính như sau:
- - Nội dung 1: Sử dụng các công cụ tin - sinh học để dự đoán số lượng và cầu
trúc intron-exon của các gene SnMKS2 hiện diện trong bộ gene của cà tím S.
melongenea.
Trang 24- _ Nội dung 2: Phân lập các trình tự CDS mã hóa protein SmMKS2 và các trình
tự gene SmMKS của ca tím S melongena.
- _ Nội dung 3: Phân tích su biểu hiện phiên mã của các gene SnMKS2 theo mô
và khi đáp ứng với các tín hiệu căng thắng bao gồm gây tạo vết thương cơhoc, xử lý với methyl jasmonate va xử lý với methyl salicylate.
- Nội dung 4: Khảo sát hoạt tính Ø-ketoacyl-ACP thioesterase của protein
SmMKS2 thông qua sự biểu hiện tái tổ hợp các trình tự CDS mã hóa protein
SmMKS2 trong tế bao vi khuẩn E coli và xác định sản phẩm Ø-ketoacid
được tạo thành trong dịch nuôi cấy.
1.4 Ý nghĩa khoa học của đề tài
Các dữ liệu khoa học về đặc điểm cấu trúc và chức năng của các gene
SmMKS2 ở cà tím S melongena là cơ sở dé phân tích, so sánh đặc điểm của các
gene SmMKS2 với các gene MKS2 đã được khảo sát khá kỹ ở loài cà chua dai S.
habrochaites và loài cà chua thuần hóa S lycopersicum Luận án này góp phần mở
rộng những hiểu biết về sự đa dạng của hệ gene MKS2 ở họ Solanaceae, VỀ CƠ SỞphân tử và sinh hóa của các chuyền hóa thứ cấp liên quan đến quá trình sinh tổng
hợp acid béo ở thực vật.
Kết quả phân tích đặc điểm điều hòa biểu hiện phiên mã của các geneSmMKS2 theo mô và trong đáp ứng với các tín hiệu căng thăng tác động lên cây cà
tím S melongena cho phép dự đoán vai trò sinh học tiềm năng của các gene này
trong quá trình đáp ứng của cà tím với một số tác động căng thang Day là cơ sở déđịnh hướng các nghiên cứu sâu hơn nhằm khang định chức năng in planta của các
gene MKS2.
Dựa trên phân tích in silico, tác giả và nhóm nghiên cứu đã thiết lập những
nghiên cứu thực nghiệm phù hợp dé kiểm chứng các giả thuyết và thu thập đượcnguồn gene cho việc nghiên cứu mở rộng các hiểu biết về cơ sở phân tử của quátrình tạo ra 2-methylketone hay các hợp chất dẫn xuất từ acid béo ở thực vật, đồngthời định hướng ứng dụng những hiểu biết này vào quá trình sản xuất các hợp chat
vừa nêu ở quy mô công nghiệp Với cách tiép cận nghiên cứu như trên, luận án là
Trang 25một tài liệu tham khảo hữu ích cho thấy sự cần thiết và tính khả thi của việc áp dụngkết hợp tin sinh học, các phương pháp sinh học phân tử và phân tích sinh hóa déphát hiện, phân tích chức năng và mở ra tiềm năng ứng dụng của các gene mới, đặc
biệt là các gene có liên quan đến quá trình sinh tông hợp các hợp chất thứ cấp có giá
trị, vốn không dé dang được sản xuất bằng con đường tông hợp hóa học
1.5 Ý nghĩa thực tiễn của đề tài
Ngoài vai trò là các hợp chất có tính năng phòng vệ cho thực vật,
2-methylketone còn là nhóm hợp chất hóa học được ứng dụng rộng rãi trong các
ngành công nghiệp thực phẩm và mỹ phẩm với vai trò là chất tao hương Hiện nay2-methylketone còn là nhóm hợp chất có nhiều tiềm năng ứng dụng trong lĩnh vựcsản xuất năng lượng sinh học Việc phân lập được thêm các gene MKS2 từ cà tím S.melongena góp phần làm phong phú hơn bộ sưu tập các gene MKS2 từ thực vật nói
chung và họ Solanaceae nói riêng, tạo cơ sở khoa học cho việc nghiên cứu phát
triển các giống cây trồng và các chủng vi sinh vật có khả năng tổng hợp các acid
béo và hợp chất dẫn xuất (2-methylketone) có khung carbon như mong muốn mộtcách có định hướng và hiệu quả, phù hợp với những ứng dụng khác nhau của nhómhợp chất này
Trang 26CHƯƠNG 2
TONG QUAN TÀI LIEU
Trang 27CHƯƠNG 2: TÔNG QUAN TÀI LIỆU
2.1 Cà tim Solanum melongena
2.1.1 Phân loại khoa học và nguồn gốc của loài Solanum melongena L
GIỚI: Plantae (Thực vật)
Angiospermae (Thuc vat hat kin)
Eudicots (Thực vật hai lá mam)
Bộ: Solanales (Bộ Cà) Họ: Solanaceae (Họ Cà hoặc Khoai tây)
Chi: Solanum (Chi Ca)
Phân chỉ: Leptostemonum (Cà gai)
Loài: Solanum melongena (Ca tim)
Hình 2.1 Cây cà tím S melongena dòng thuần được sử dung trong nghiên cứu
Cà tím S melongena (Hình 2.1) là cây nông sản phô biến ở các nước Châu
Á, Trung và Cận Đông, Dia Trung Hải và Châu Phi S melongena thuộc họ
Solanaceae, chi Solanum và là loài đại diện của phân chi Leptostemonum [12].
Không giống như các loại cây trồng Solanaceae quan trọng khác như cà chua, khoai
Trang 28tây, ớt, và thuốc lá, tất cả đều có nguồn gốc ở Nam Mỹ và được trồng trên toàn thếgiới, cà tím S melongena là loài ban địa của các quốc gia thuộc Cựu Thế giới (Châu
Âu, Châu Á, Châu Phi) và do đó xét về mặt phát sinh loài, cà tím khác biệt vớinhững loài khác thuộc họ Solanaceae [12] Vì vậy, các thông tin di truyền của càtím là một phần dữ liệu quan trọng cho các nghiên cứu so sánh về di truyền, sinh lýhọc, sự phát triển và tiễn hóa của họ Solanaceae
2.1.2 Cơ sở dữ liệu bộ gene của cà tím S melongenea
Sự phát triển không ngừng của các kỹ thuật giải trình tự nucleotide đã cho
phép nhiều nhóm nghiên cứu trên thế giới tiến hành giải mã trình tự bộ gene hoặcthư viện cDNA của nhiều loài khác nhau Solanaceae là một trong những họ cónhiều loài đã được giải mã bộ gene, ví dụ như cà chua thuần hóa S lycopersicum, cà
chua bi Solanum pimpinellifolium Consortium [13], khoai tây Solanum tuberosum
[14], ớt Capsicum annuum [15], ca tím S melongena, thuốc lá Nicotiana
benthamiana [16] va Nicotiana tabacum [17] Vi thé, các loài trong ho nay thường
được chọn làm loài thực vật mô hình trong nhiều nghiên cứu sinh học co bản vaứng dụng Năm 2001, bản đồ liên kết các chỉ thị phân tử DNA (DNA markerlinkage map) đầu tiên của cây cà tím đã được xây dựng dựa trên chỉ thị đa hình các
phân đoạn DNA được khuếch đại ngẫu nhiên (random amplified polymorphic
DNA-RAPD) và chỉ thị đa hình độ dài đoạn khuếch đại (amplified fragment lengthpolymorphism-AFLP) trong quan thé F2 tao ra từ phép lai giữa các dòng ca timthuần [18] Kê từ đó, nhiều nhóm nghiên cứu đã không ngừng nỗ lực tích lũy thêmthông tin di truyền phân tử cho cây cà tím, bao gồm các trình tự biểu hiện(Expressed Sequence Tags - ESTs) [19], những trình tự đơn giản lặp lại (simple
sequence repeats-SSRs) [20, 21], các đa hình nucleotide đơn (single-nucleotide
polymorphisms-SNPs) [22] nhằm phát triển chi tiết hon bản đồ liên kết bộ gene của
loài này Năm 2014, bộ gene của cả tím S melongena đã được giải trình tự, cơ sở
dữ liệu bộ gene SME 12.5.1 của loài này bao gồm 33.873 scaffold với kích thước
833.1 Mb (74% kích thước bộ gene ca tím) Ước tinh cơ sở dữ liệu SME_12.5.1 bao
phủ khoảng 90% bộ gene cà tím, trong đó có khoảng 85.446 gene đã được dự đoán.
Trang 29Kết quả phân tích cụm (clustering analysis) trên các gene giả định của cà tím, của
ba loài cây khác trong họ Cà (cà chua, khoai tây, thuốc lá) và của A thaliana theo
cụm các gene tương đồng cho thấy rằng trong số 35.000 cụm gene được hình thành
có 4.018 cụm gene chỉ hiện diện ở cả tím Những gene nảy có thể quy định nhữngtính trạng riêng của cà tím [23] Kết quả đối sánh thông tin bộ gene của cà chuathuần hóa S lycopersicum với cà tím S melongena đã cho thấy có 16.573 cặp gene
tương đồng giữa hai loài, trong đó mỗi cặp gene đã tiễn hóa từ một gene tổ tiên
chung Ngoài ra, 9.489 (28%) trong 33.873 scaffold của cà tím có thể được ánh xạvào các vị trí tương ứng trên hệ gene của cà chua và 56 vùng bảo tồn về trật tự sắpxếp các gene (conserved synteny blocks) đã được xác định giữa hai loài [23] Hiện
tại, cơ sở dữ liệu bộ gene cà tím đã được giải mã tương đối hoàn chỉnh với khoảng
35.000 gene đã được định danh và định vị trên 12 nhiễm sắc thể của cây cà tím [10,24] Các phân tích đối sánh chỉ tiết giữa bộ gene của cà tím và các loài khác cùng
họ mang lại những hiểu biết đầy đủ hơn về tính đa dạng di truyền của họSolanaceae, góp phần hỗ trợ các nghiên cứu giúp cải tiến các đặc tính nông học của
các cây trong họ này.
Nhiều loại cây trồng trong ho Solanaceae nói chung và cây ca tím S
melongena nói riêng là cây hằng niên, sản phẩm được thu hoạch liên tục, khiến cho
việc bảo vệ cây trồng khỏi nắm bệnh và sâu hại gặp nhiều khó khăn hơn Hơn nữa,
khi chế biến, quả cả tím được sử dụng luôn cả vỏ nên người trồng cần hạn chế sử
dụng các loại thuốc bảo vệ thực vật Sự hoàn thiện dần cơ sở dữ liệu bộ gene của càtím góp phần đây mạnh các nghiên cứu về gene tham gia trong sự đáp ứng với sâu
bệnh gây hại ở loài này [25-27].
2.2 Methylketone synthase 2 tham gia chính trong con đường sinh tổng hợp
2-methylketone ở cà chua dại S habrochaites
Những hiểu biết ở mức độ phân tử về con đường sinh tổng hợp
2-methylketone ở loài ca chua đại S habrochaites chỉ mới được công bồ trong khoảnghơn một thập kỷ gần đây Antonious và cộng sự (2001) đã ghi nhận trong lông tiếttrên thân và lá cà chua dại S habrochaites tích lũy một lượng lớn 2-methylketone
Trang 30(2,7 — 5,5 mg methylketone trên 1 g trọng lượng lá tươi), chủ yếu là
2-undecanone và 2-tridecanone, trong khi cây cà chua thuần hóa S lycopersicum chỉ
tích lũy một lượng 2-methylketone không đáng ké [28] Sau đó, Fridman va cộng sự(2005) đã ghi nhận một trình tự cDNA mã hóa protein tương đồng với các esterase
ở thực vật và hiện diện trong cơ sở dữ liệu EST của lông tiết cà chua đại Š.habrochaites (accession PI126449) với tần số cao hơn nhiều so với trong cơ sở ditliệu EST của lông tiết cà chua thuần hóa S lycopersicum (accession LA1777)
cDNA nay được đặt tên là methylketone synthase I (MKS1) [29] Két qua phan tich
kiểu hình các cá thé trong quan thé lai giữa cà chua dai S habrochaites với cà chuathuần hóa S lycopersicum cho thấy trong số các gene có liên quan đến con đườngsinh tổng hợp 2-methylketone ở cà chua dại có một gene mã hóa protein tương đồngvới 4-hydroxybenzoyl-CoA thioesterase có nguồn gốc từ vi khuẩn Pseudomonas
(ký hiệu là Ps4HBT) Gene được đặt tên là methylketone synthase 2 (MKS2) Cáccây F2 có khả năng tổng hợp nhiều 2-methylketone biểu hiện gene MKS2 cao gấp
337 lần so với các cây F2 tong hợp ít hoặc không tổng hợp 2-methylketone Thêmvào đó, cây cà chua F2 biểu hiện đồng thời cả hai gene MKS/ và MKS2 tích lũynhiều 2-tridecanone, các cây chỉ biểu hiện gene MKS2 vẫn có thé tổng hợp mộtlượng nhỏ 2-methylketone, trong khi các cây chỉ biéu hiện gene MKS/ thì hoàn toànkhông tổng hợp 2-methylketone Với kết qua này, sự tong hợp 2-methylketone diễn
ra trong lông tiết được cho là có sự tham gia của cả MKS2 và MKSI, trong đó sản
phẩm của phan ứng được xúc tác bởi MKS2 là cơ chất cho phản ứng được xúc tác
bởi MKS] [1].
Trên cơ sở đó, Yu va cộng sự (2010) da tiến hành phân lập và nghiên cứu
chức năng của hai gene MKS/ và MKS2 ở cà chua dại S habrochaites (còn được
gọi là ShMKSI và ShMKS2) [3] Gene ShMKS2 mã hóa protein thuộc nhóm
thioesterase có vùng gấp cuộn “hot-dog” đơn (single hot-dog thioesterase) và có
hoạt tính Ø-ketoacyl-ACP thioesterase - xúc tác phản ứng thủy phân liên kếtthioester trong cơ chất Ø-ketoacyl-ACP (chất trung gian trong con đường sinh tổnghợp acid béo diễn ra ở lục lạp của thực vật) để tạo thành các Ø-ketoacid (hay 3-
Trang 31ketoacid) tương ứng Gene ShMKS/ mã hóa protein thuộc nhóm thioesterase có
vùng gấp cuộn “z/Ø hydrolase” Tuy nhiên, ShMKS1 từ loài cà chua dại không thé
hiện hoạt tính hydrolase như đa số các thành viên khác trong nhóm enzyme này mà
thay vào đó là hoạt tính Ø-ketoacid decarboxylase [30] ShMKSI xúc tác phản ứng
khử nhóm carbonyl của các Ø-ketoacid (sản phẩm của phản ứng được xúc tác bởiShMKS2) dé tạo thành 2-methylketone có chiều dai chuỗi ngắn hơn một nguyên tử
carbon Hai phản ứng được xúc tác bởi SAMKS1 và ShMKS2 diễn ra ở loài cà chua
dại được mô tả như ở Hình 2.2 [3].
O O me O O 0
MKS2 MKS1
RCPS) Ch —nN HO" ~~ (CHa,CH, ———” Hac (CHa) Cy
R-SH CO,
B-ketoacyl-ACP B-ketoacid 2-methylketone
Hình 2.2 Hai phan ứng cuối trong con đường sinh tổng hợp 2-methylketone [3]
Cà chua dại S habrochaites tạo ra 2-methylketone thông qua con đường sinh
tổng hợp acid béo Con đường sinh tổng hợp acid béo ở thực vật phần lớn diễn ratrong lục lạp như được mô tả ở Hình 2.3 [7] Con đường này bắt đầu với phản ứng
carboxyl hóa acetyl-CoA thành malonyl-CoA nhờ enzyme acetyl-CoA carboxylase
(ACCase) Ở phản ứng tiếp theo, CoA được chuyển đổi thành ACP nhờ enzyme malonyl-CoA:ACP transacylase (MCAT) Enzyme Ø-ketoacyl-
malonyl-ACP synthase III (KAS III), được mã hóa bởi gen fabH, xúc tác phản ứng ngưng tụ
đầu tiên giữa malonyl-ACP với acetyl-CoA tạo thành butyryl-ACP Butyryl-ACPsau đó đi vào một chu trình gồm bốn phản ứng được xúc tác bởi Ø-ketoacyl-ACP
reductase (KAR), /-hydroxyacyl-ACP dehydrase (DH), enoyl-ACP reductase(ENR) và Ø-ketoacyl-ACP synthase I (KAS D dé tao ra mét Ø-ketoacyl-ACP mới cóchuỗi carbon đài thêm hai nguyên tử carbon Các f-ketoacyl-ACP tiếp tục trải qua
6-7 chu trình phản ứng như vậy đến khi đạt được chiều dài khung carbon là 16C
hoặc 18C [7] Các Ø-ketoacyl-ACP khi bị thủy phân bởi enzyme ShMKS2 thì tạo
thành Ø-ketoacid Kết quả khảo sát sự định vị dưới mức tế bào (subcellular
10
Trang 32localization) cũng cho thấy protein ShMKS2 hiện diện trong lap thé, nơi có con
đường sinh tổng hợp acid béo xảy ra và Ø-ketoacyl-ACP, cơ chất của ShMKS2, là
chất trung gian của con đường nay [3] -Ketoacid sau đó được biến đổi thành
2-methylketone thông qua phan ứng khử nhóm carbonyl bởi enzyme ShMKSI cũng
định vị trong lạp thể ShMKS2 thủy phân hiệu quả nhất Ø-ketomyristoyl-ACP
(14:0) và Ø-ketolauroyl-ACP (12:0) tạo thành Ø-ketoacid tương ứng là
/-ketomyristic acid và /Ø-ketolaurie acid Vì vậy 2-methylketone được tông hợp tronglông tiết ca chua dai chủ yếu bao gồm 2-tridecanone (13:0) và 2-undecanone (11:0)
“OOC —HạC ị S—ACP mAs! HạO—”2 (C4 to 16) Cycle 7 ?
(Malonyl-ACP) KAS II times for
R = Chg after KAS III reaction NADPH NADP*
R = CH3CH2CH, after second cycle +H
R = CH;CH;CH;CH;ChH; after third cycle
Etc.
Hình 2.3 Con đường sinh tông hợp acid béo ở thực vat [7]
ACP: acyl carrier protein; MCAT: malonyl-CoA:ACP transacylase; KAS: /-ketoacyl-ACP synthase, KR: -ketoacyl-ACP reductase, DH: /-hydroxyacyl-ACP dehydrase; ENR: enoyl-ACP
reductase; TE: acyl-ACP thioesterase.
11
Trang 332.3 Hệ gene methylketone synthase 2 ở thực vat
Gene MKS2/ALT hiện diện phố biến ở nhiều loài thực vật Các gene này cóchiều dài rất khác nhau nhưng có đặc điểm chung là bao gồm 5 exon và 4 intron,
trong đó exon đầu tiên mã hóa trình tự peptide vận chuyên Ngoài ShMKS2 được
phân lập đầu tiên ở loài cà chua dai S habrochaires, ba gene SIMKS2a, SIMKS2b
và SIMKS2c từ loài cà chua thuần hóa S lycopersicum mã hóa protein tương đồng
với ShMKS2 hơn 70% cũng đã được phân lập và khảo sát chức năng bởi cùng
nhóm nghiên cứu [3] Pulsifer và cộng sự (2014) đã phân lập được bốn gene thuộc
họ acyl thioesterase từ A thaliana mã hóa cho các protein tương đồng 50-62% vớiShMKS2 và chúng được đặt tên lần lượt là acyl-lipid thioesterase 1 (AL71), ALT2,ALT3 va ALT4 [5], đồng thời cũng phân tích hoạt tính in vivo của các ALT nàythông qua biểu hiện tái tổ hợp ở E coli K27 Kalinger và cộng sự (2018) đã tìmthấy 14 protein tương đồng với các MKS2/ALT đã biết từ một số loài thực vật đạidiện nhóm cây một lá mam, hai lá mầm, thực vật cổ, vi tao và thực vật hạt trần vàphân tích hoạt tính in vivo (thông qua biểu hiện tái tổ hợp ở E coli K27) của cácALT này Cu thể, ngô Zea mays có bốn gene ZmALTI, ZmALT2, ZmALT3 vaZmALT4, dương xi Selaginella moellendorffii có gene SmoALT1, nho Vitis vinifera
có gene VVALT], lúa Oryza sativa có gene OsALTI, Brachypodium distachyon có
hai gene BdALTI và BdALT2, dau Medicago truncatula có hai gene MtALTI,
MIALT2, tao Chlamydomonas reinhardtii có gene CrALT1, gai dau Cannabis sativa
có gene CsALTI và bạch quả Gingko biloba có gene GbALTT [31].
Tại Việt Nam, nhóm nghiên cứu của tác giả cũng đã phan lập được một sỐgene mã hóa protein tương đồng với ShMKS2 từ các cây ho Solanaceae Cụ thé, ớt
C annuum có một gene CaMKS2 mã hóa protein tương đồng 63% so với ShMKS2
[32] Thuốc lá N tabacum có hai gene NtMKS2-1 và NtMKS2-2 mã hóa protein
tương đồng 63% và 62% so với ShMKS2 [33] Ngoài ra, nhóm nghiên cứu đã sử
dụng các công cụ tin - sinh học dé tra cứu cơ sở dữ liệu bộ gene của loài cả chua bị
S pimpinellifolium va tìm thay ba gene SppMKS2-1, SppMKS2-2 và SppMKS2-3tuong đồng hơn 65% với trình tự ShMKS2 [34] Ngoài các cây đại diện họ
12
Trang 34Solanaceae, chúng tôi cũng ghi nhận có một gene GmMKS2 hoạt động ở đậu nành
G max [6].
Cho dén nay ca chua dai S habrochaites 1a loai duy nhat trong ho
Solanaceae được biết có khả năng tổng hợp nhiều 2-methylketone [28] Ngược lại,
cà chua thuần hóa S lycopersicum mặc du có đến ba gene mã hóa cho protein tươngđồng với ShMKS2 nhưng lai tổng hợp rat ít 2-methylketone [3, 28] Dé cải thiệnkhả năng đối kháng sâu bệnh và côn trùng gây hại của cà chua thuần hóa, các nhà
khoa học đã tiễn hành lai tạo giống cà chua đại với cà chua thuần hóa nhằm tạo ra
các giống cà chua lai có khả năng tổng hop một lượng lớn 2-methylketone nhưng đãkhông thành công Sự khác biệt về số lượng gene MKS2 cũng như mức độ tích lũy2-methylketone ở S habrochaites và S lycopersicum cùng với sự thất bại trong việctạo ra giống cà chua mới có khả năng tổng hợp 2-methylketone từ sự lai tạo giữa hailoài trên đã đặt ra các câu hỏi về cấu trúc, chức năng, sự điều hòa hoạt động và sự
tiến hóa của hệ gene MKS2 ở ca chua và các loài thực vật khác thuộc ho
Solanaceae Các nghiên cứu về hệ gene MKS2 ở những các loài Solanaceae đại điệnkhác có thé góp phan mang lại những hiểu biết đầy đủ và toàn diện hơn, làm tiền décho việc khai thác nguồn gene này trong công tác chọn tạo giống
2.4 Sự đa dang trong hoạt tính xúc tác in vivo của các MKS2 từ thực vật
Các MKS2/ALT đã được nghiên cứu trước đây thường thé hiện hoạt tính
thioesterase trên phổ cơ chất rộng, với khung carbon có thé đa dạng về chiều dài,
mức độ bão hòa và tình trạng oxy hóa của chuỗi acyl Các cơ chất này rất kém bền
và hiện chưa được tổng hợp dé thương mai hóa nên việc tim kiếm hoặc chuẩn bịnguồn acyl-ACP tinh khiết và đa dang dé làm cơ chất cho nghiên cứu hoạt tính xúc
tác in vitro của các MKS2/ALT là một thách thức lớn Do tế bào chủ E coli chứa
nguồn cơ chất acyl-ACP nội sinh đa dạng và phong phú, phương pháp khảo sát hoạt
tính xúc tác in vivo thông qua biểu hiện gene mã hóa MKS2/ALT trong tế bào E
coli đã được sử dụng thay thé trong nhiều nghiên cứu đã công bố [3, 5, 6, 31] Mặtkhác, phương pháp biểu hiện gene trong tế bào E coli có nhiều ưu điểm như thời
13
Trang 35gian tăng trưởng của vi khuân ngắn, thành phần môi trường đơn giản và quá trìnhbiến nạp diễn ra nhanh chóng [35].
Bên cạnh đó, sản phẩm chính được tông hợp bởi các MKS2/ALT thường là
các /Ø-ketoacid vốn cũng rất kém bền nên việc định lượng trực tiếp không có tính
kha thi [36] 6-Ketoacid là những acid béo chứa nhóm ketone (-C=O) ở nguyên tử
carbon ở vị tri Cs so với nhóm carboxyl và vi vậy Ø-ketoacid dé dang bị decarboxyl
hóa, đặc biệt là trong điều kiện nhiệt độ cao, để tạo thành các 2-methylketone [3,
37] 2-Methylketone là các hợp chất bay hơi có thể được phát hiện và định lượng
bằng phương pháp sắc ký khí Do đó, thành phần các Ø-ketoacid tích lũy trong dịchnuôi cay tế bào E coli biểu hiện gene MKS2/ALT có thé được xác định một cáchgián tiếp thông qua phân tích thành phần 2-methylketone tương ứng được tạo thành
[3].
Khi được biểu hiện ở vi khuẩn E coli, mỗi MKS2/ALT từ thực vật tao ramột hồ sơ Ø-ketoacid (Ø-ketoacid profiles) đặc trưng và không trùng lặp với các
MKS2/ALT khác Nói cách khác, các MKS2/ALT khác nhau từ cùng loài hay khác
loài thực vật đều có hoạt tính thioesterase nhưng chúng hoạt động trên phổ cơ chấtriêng biệt TẾ bào E coli BL21(DE3) biểu hiện ShMKS2 có khả năng tông hợp các
Ø-ketoacid 12:0, 14:0, 14:1 và 16:0 mà sau đó lần lượt bị khử carboxyl hóa thành
các sản phẩm cuối 2-undecanone (11:0), 2-tridecanone (13:0), 2-tridecenone (13:1)
và 2-pentadecanone (15:0) [1, 3] Trong khi đó, kết quả phân tích hoạt tính in vivo
của SIMKS2a từ S lycopersicum (tương đồng 74% với ShMKS2 từ S.habrochaites) thông qua biểu hiện tái tổ hợp trong tế bao vi khuẩn E coliBL21(DE3) cho thay thành phần 2-methylketone sinh ra từ dich nuôi cấy gồm có 2-tridecenone (13:1) là sản phẩm chính, 2-nonanone (9C) và 2-undecanone (11C) làcác sản phẩm phụ [1, 3] Các ALTI-4 từ A thaliana khi được biểu hiện trong chủng
E coli K27 (DE3) khuyết gene mã hóa acyl-CoA synthetase (FadD) có kha năng
chuyền hóa một loạt các acyl-ACP nội sinh thành các acid béo tương ứng, trong đó
có các /Ø-ketoacid không bền mà sau đó nhanh chóng bị decarboxyl hóa thành các methylketone [5] Cu thé, dich nuôi cay chung E coli biểu hiện ALTI có sự hiện
2-14
Trang 36diện của các acid béo 12:0, 14:0, 14:1, 16:0 và 16:1 Dịch nuôi cay chung E coli
biểu hiện ALT2 cho ra một lượng lớn 2-heptanone (7:0) và 2-nonanone (9:0) sau
khi được đun nóng, bên cạnh một lượng nhỏ acid béo 8:0 được phát hiện trong dich
nuôi cấy Dịch nuôi cấy chủng E coli biểu hiện ALT3 chứa các acid béo 12:0, 14:0,
14:1 và 16:1, đồng thời tạo ra 2-tridecenone (13:1) và các 2-methylketone bão hòamang chuỗi carbon lẻ dao động từ 7C đến 15C khi được đun nóng Dịch nuôi caychủng E coli biểu hiện tái tổ hợp ALT4 tích lũy chủ yếu các acid béo chuỗi ngắn
6:0 và 8:0, một lượng nhỏ acid béo 10:0 và 16:1 và các Ø-ketoacid 8:0, 14:0 và 16:0
(khi được xử lý nhiệt thì tạo ra các 2-methylketone 7:0, 13:0 và 15:0) [5].
Nghiên cứu phân tích hoạt tính in vivo (thông qua biểu hiện tái tô hop ở E.coli K27) của 14 protein tương đồng với MKS2/ALT trong nhiên cứu của Kalinger
và cộng sự (2018) cũng cho kết luận tương tự Dựa trên nhóm sản phẩm chính được
tạo thành, các protein tương đồng với MKS2/ALT này được chia thành 4 phân
nhóm Nhóm một gồm ZmALT2, MtALT2, VvALTI, AtALT3, SmoALTI,BdALT1, BdALT2, CsALT1 và OsALT1, tạo ra sản phẩm chủ yếu là B-ketoacid cókhung carbon không bão hòa chứa 14C (14:1) Nhóm hai gồm MtALTI, ZmALT3
và AtALT4, sản xuất các acid béo có khung carbon dai 6-10C Nhóm ba gồmAtALTI và ZmALTI, tạo ra sản phâm chính là acid béo 12-14C Nhóm 4 gồmCrALT1 và ZmALT4, chủ yếu tổng hợp các acid béo 16C [31] Gần đây nhất, kếtquả phân tích hoạt tính in vivo của GmMKS2 từ G max thông qua biểu hiện tái tổhợp trong tế bao vi khuẩn E coli C41 (DE3) cho thay sản phẩm chủ yếu trong dichnuôi cấy là Ø-ketoacid 14:1 [6]
Từ các kết qua phân tích hoạt tinh in vivo của các MKS2/ALT kề trên, có thể
thấy rõ các enzyme MKS2/ALT có khả năng sử dụng cơ chất với khung carbon đa
dạng về chiều dài, mức độ bão hòa và tình trạng oxy hóa của chuỗi acyl Vì thế,
việc phân lập và nghiên cứu chức năng các gene mã hóa cho các enzyme
MKS2/ALT mới đang được các nhà khoa học quan tâm nhằm làm phong phú hơn
bộ sưu tập gene MKS2/ALT và cung cấp cơ sở khoa học dé làm rõ hơn sự tươngquan giữa trình tự các protein với phố cơ chat mà enzyme sử dụng Từ đó, chúng ta
15
Trang 37có thé mở rộng các nghiên cứu hướng tới sự tổng hợp các 2-methylketone có khungcarbon như mong muốn một cách định hướng dé đáp ứng nhu cầu ứng dụng khác
nhau của nhóm hợp chất 2-methylketone
2.5 Methylketone synthase 2 là acyl-ACP thioesterase có cấu trúc gấp cuộn
kiểu “hot-dog” đơn
Các enzyme thioesterase (TE) (EC 3.1.2) xúc tác phản ứng thủy phân liên kết
thioester giữa chuỗi acyl và CoA, giữa chuỗi acyl và ACP hoặc giữa chuỗi acyl và
cysteine trong protein Thioesterase tham gia trong một số quá trình sinh học quan
trọng như tong hop acid béo, chuyên hóa acyl-CoA, hoặc biến đổi sau dich mã của
protein Dựa trên trình tự amino acid, các thioesterase được chia thành 35 họ khácnhau (ký hiệu TEI đến TE35) [38] Các thioesterase trong cùng một họ có trình tựtương đồng ít nhất 15%, thường lớn hơn 30%, và có cấu trúc bậc ba gần giống
nhau Chúng cũng có chung cơ chế xúc tác và các amino acid tham gia vào hoạtđộng xúc tác định vi ở cùng một vi trí Dựa trên cấu trúc không gian ba chiều, các
thioesterase thuộc họ TEI, TE3 va TE34 lần lượt chứa gấp cuộn kiểu NagB,
SGNH-hydrolase va beta-hairpin (C-terminal)-TIM barrel (N-terminal), TE23 vàTE32 chứa gap cuộn kiểu lactamase, các thioesterase còn lại chủ yếu có gấp cuộn
al hydrolase hoặc gấp cuộn “hot-dog” Trong đó, các thioesterase có gấp cuộn
“hot-dog” có thê được phân thành hai nhóm: thioesterase có gấp cuộn “hot-dog” đôi
(double hot-dog thioesterase) và thioesterase có gấp cuộn “hot-dog” đơn (single
hot-dog thioesterase) [38, 39].
FatA và FatB là hai acyl-ACP thioesterase có gấp cuộn “hot-dog” đôi điểnhình, được bảo tồn cao ở thực vật và đã được nghiên cứu khá kỹ Chúng thuộc họTE14 (EC 3.1.2.14), xúc tác phản ứng thủy phân liên kết thioester của các acyl-
ACP và tạo ra các acid béo tự do tương ứng [38, 40-42] FatA ưu tiên sử dụng cơ
chất acyl-ACP không bão hòa đơn, đặc biệt là oleoyl-ACP (18:1A9), trong khi FatB
gồm những thioesterase hoạt động trên các acyl-ACP bão hòa với chuỗi carbon daođộng từ 8 đến 16 carbon và được chia thành ba phân lớp FatB phân lớp 1 đặc hiệuvới cơ chất acyl-ACP 14-1óC và hiện diện phổ biến trong hầu hết các mô thực vật
16
Trang 38[41] FatB phân lớp 2 cĩ phổ cơ chất rộng hơn gồm các acyl-ACP bão hịa 6-14C,
biểu hiện trong hat của một số cây hạt cĩ dầu, chăng hạn như Cuphea spp va
Umbellularia californica [43-46] FatB phân lớp 3 hoạt động chủ yếu trên
acyl-ACP 8C [47].
Trong hon một thập ky gần đây, một nhĩm các methylketone synthase 2(MKS2), cịn được biết đến với tên gọi là acyl-lipid thioesterase (ALT) cĩ khả năngthủy phân liên kết thioester của các acyl-ACP với chuỗi acyl đa dạng về chiều dài
(C8-C18), mức độ bão hịa và trạng thai oxy hĩa của các nguyên tử carbon thành
các acid béo tương ứng, trong đĩ cĩ dang sản phẩm khơng bền là f-ketoacid — tiềnchất trực tiếp của 2-methylketone [3, 5, 6, 31] MKS2/ATL2 được xếp vào họ TE9
(EC 3.1.2.18) [38] Trong khi các thioesterase FatB phân nhĩm 2 hoạt động chuyênbiệt với với chuỗi acyl-ACP chuỗi trung bình chỉ hiện diện ở một số lồi thực vật,
các thioesterase MKS2/ALT đã được tìm thấy ở tất cả các nhĩm đơn vị phân loại
thực vật chính [31] ShđMKS2 từ cà chua đại S habrochaites được dự đốn cĩ cấutrúc gấp cuộn kiểu “hot-dog” đơn và khơng tương đồng với FatA và FatB về trình
tự amino acid Khác với FatA và FatB, MKS2/ALT tham gia vào các quá trìnhchuyên hĩa lipid chuyên biệt hơn [3, 5, 6, 31]
Gấp cuộn “hot-dog” được định nghĩa lần đầu tiên trong cấu trúc tinh thé củaØ-hydroxydecanoyl thiolester dehydratase (FabA) từ E coli (mã số PDB là IMKA).FabA xúc tác sự khử nước dé hình thành liên kết đơi trong phan ứng chuyên hĩa 3-
hydroxydecanoyl-ACP thành enoyl ACP và sau đĩ đồng phân hĩa
(E)-2-enoyl ACP thành (Z)-3-dec(E)-2-enoyl-ACP (Hình 2.7) [48] 4-Hydroxybenzoyl-CoA
thioesterase từ Pseudomonas sp CBS-3 (ký hiệu là Ps4HBT, mã số PDB là 1BVQ)
là cấu trúc protein chứa gấp cuộn “hot-dog” tiếp theo được giải mã [49]
Pseudomonas sp CBS-3 là vi khuẩn sống trong đất cĩ khả năng sinh trưởng trên
mơi trường chứa 4-chlorobenzoate là nguồn carbon duy nhất [50] Ps4HBT thủy
phân liên kết thioester của 4-hydroxybenzoyl-CoA thành 4-hydroxybenzoate - bướcphan ứng cuối cùng trong con đường chuyển hĩa 4-chlorobenzoate thành 4-hydroxybenzoate [51] Phân tích cau trúc khơng gian của phức hợp Ps4HBT gắn cơ
17
Trang 39chất 4-hydroxybenzoyl-CoA cho thấy aspartate ở vị trí thứ 17 (Asp”) có vai trò
quyết định hoạt tính thioesterase của enzyme có cấu trúc gấp cuộn kiểu “hot-dog”
đơn này [49, 52] Mặc dù các MKS2/ALT có mức độ tương đồng trình tự vớiPs4HBT khá thấp (nhỏ hơn 15%) nhưng kết quả sắp gióng cột trình tự giữa cácMKS2/ALT và Ps4HBT cho thấy vị tri Asp!’ quan trọng đối với hoạt tínhthioesterase của Ps4HBT được bảo tồn trong tất cả các MKS2/ALT được khảo sát[1, 3, 5, 6] Thêm vào đó, khi gây đột biến điểm định hướng thay đổi aspartate (D)
tương ứng của ShMKS2 từ S habrochaites, GmMKS2 từ G max và ALTI từ A.
thaliana thành alanine (A), các biến thể enzyme đột biến sinh ra gồm D79A, GmMKS2-D8IA và ALTI-D64A đều bị mat hoàn toàn hoạt tinhthioesterase [3, 5, 6] Điều này cho thấy các MKS2/ALT cũng chứa aspartate ở vi tritương ứng có vai trò quyết định hoạt tính thioesterase tương tự như Ps4HBT
ShMKS2-Sau đó, cau trúc tỉnh thể của hai thioesterase giả định từ Thermusthermophiles với mã sô PDB lần lượt là 1Z54 và 2CYE đã được công bố [53] Hai
cau trúc gấp cuộn “hot-dog” này được xem là “cấu trúc bắt cầu” góp phan khangđịnh ShMKS2 là một thioesterase có cấu trúc gấp cuộn kiểu “hot-dog” đơn tương tựnhư Ps4HBT Enzyme thứ nhất, 1Z54, là một thioesterase thuộc họ TE9 [39] và cótrình tự tương đồng với ShMKS2 và Ps4HBT lần lượt là 34% và 26% Đáng chú ý,phần khung chính trong cấu trúc gấp cuộn “hot-dog” đơn của 1Z54, gồm một phiến
Ø đối song (được hình thành từ năm sợi Ø sắp xếp song song ngược chiều) bao lấysợi xoắn ø dai ở trung tâm, gần như chồng lấp hoàn toàn với cấu trúc Ps4HBT(Hình 2.4) Enzyme thứ hai, 2CYE, có mức độ tương đồng về trình tự với ShMKS2
và Ps4HBT lần lượt là 30% và 19%, và quan trọng hơn, vị trí gắn CoA của protein2CYE hiển thị qua cấu trúc tinh thể của phức hợp enzyme-cơ chất 2CYE-CoA chothấy tâm hoạt động của 2CYE được bảo ton ở vị trí tương tự như tâm hoạt động của
Ps4HBT (Hình 2.5) [53].
Như vậy, dựa trên sự tương đồng cao về cau trúc giữa Ps4HBT với 1254, sựbảo tồn giữa PS4HBT và 2CYE về cau trúc tong thé va vi tri tam hoat động, mức độtương đồng trình tự giữa MKS2/ALT với hai thioesterase 1Z54 và 2CYE (khoảng
18
Trang 4030%) và sự hiện diện bảo tồn của aspartate cũng như tầm quan trọng của nó đối với
hoạt tính xúc tác của MKS2/ALT và Ps4HBT, các MKS2/ALT được dự đoán là có
thể cũng chứa cấu trúc gấp cuộn “hot-dog” đơn tương tự như 1Z54, 2CYE và
Ps4HBT [1] Cho đến nay, cấu trúc tinh thể của các protein MKS2/ALT từ các loài
thực vật vẫn chưa được xác định, tuy nhiên cau trúc của chúng có thể được môphỏng bằng phương pháp mô hình hóa cau trúc protein dựa trên sự tương đồng với
các protein đã được giải mã câu trúc nêu trên.
Hình 2.4 Cau trúc gấp cuộn “hot-dog” đơn của 1Z54 (màu tím) xếp chồng lên cầu
trúc Ps4HBT (màu xanh)
Hình 2.5 Cau trúc của phức hợp enzyme-co chất 2CYE-CoA (màu vàng) xếp chồng
lên cấu trúc của phức hợp Ps4HBT- 4-hydroxybenzoyl-CoA (màu xanh)
19