Miền protein của OCT4 được trình bày ở hình 2.4.
Hình 2.4: Cấu trúc miền của protein OCT4
OCT4 (yếu tố phiên mã gắn với octamer 4) còn được gọi là POU5F1, là một nhân tố phiên mã thuộc họ POU (POU trancription factor family), lớp 5, yếu tố phiên mã 1, thuộc họ protein liên kết DNA POU (Pit, Oct, Unc). OCT4 nằm trên NST số 6 ở người (6p21.33), gene dài 6.4 kbp. OCT4 chứa một trình tự nhận diện octamer (8bp) được thấy trong promoter và enhancer của nhiều gen chuyên biệt và biểu hiện thường xuyên [24]. OCT4 dường như chỉ biểu hiện ở các dòng tế bào vạn năng [50]. OCT4 biểu hiện trong phôi chuột ở các giai đoạn phôi sớm từ 4-8 tế bào, đến khi “ngoại phôi bì” bắt đầu biệt hóa. Phôi chuột đột biến OCT4 sẽ chết sau khi làm tổ bởi thiếu khối tế bào bên trong (inner cell mass - ICM) [24] và phôi này chỉ có duy nhất một tế bào là tế bào túi phôi (trophoblast).
Tế bào gốc phôi ở chuột (mouse embryonic stem cell - mESC) bị giảm biểu hiện của OCT4 sẽ biệt hóa thành tế bào túi phôi [16] và nếu gia tăng sự biểu hiện của OCT4 trong mESC có thể làm các tế bào này biệt hóa. Có thể OCT4 ức chế biệt hóa thành tế bào túi phôi và hoạt động cùng các nhân tố phiên mã khác hay các yếu tố đồng điều hòa (co-regulator), và tỷ lệ giữa nồng độ của các nhân tố đó sẽ quyết định số phận của tế bào [1]. Vai trò của OCT4 trong sự duy trì tính đa năng của tế bào gốc phôi người (human embryonic stem cell - hESC) giống với vai trò của nó trong mESC. Sự phiên mã OCT4 bị hạn chế ở tế bào gốc phôi và trong tế bào vạn năng invitro. Sự biểu hiện ở mức độ thấp các marker OCT4 đã được phát hiện trong nhiều dòng tế bào ngoại bì hay ngoại bì thần kinh (octoderm/neurooctoderm) cả ở invitro và invivo. Thí nghiệm trên chuột loại bỏ gen OCT4 cho thấy, OCT4 giữ vai trò quyết định trong sự thiết lập tính đồng nhất của tế bào gốc vạn năng [26].
13
Hai tiểu phần của OCT4 được tổng hợp bằng cách cắt nối thay thế (alternative splicing) Pou5f1 mRNA. Hai tiểu phần, OCT4-IA và OCT4-IB có kích thước lần lượt là 360 và 265 axit amin, trong đó có 225 axit amin tại đầu C giống hệt nhau, khác nhau về trình tự ở đầu N. OCT4-IA phải đạt đến ngưỡng nhất định để duy trì khả năng tự đổi mới và toàn năng của tế bào gốc, OCT4-IB đã được chứng minh không liên quan đến việc này. Trong cơ thể, mRNA của OCT4 có măt trong các giai đoạn phôi sớm, từ noãn bào chưa được thụ tinh cho đến hình thái chưa hoàn chỉnh (uncompacted morula). OCT4 có vai trò quyết định sự phân cực của hợp tử bằng cách cùng với yếu tố phiên mã SOX2, KLF4 tạo thành phức hợp ba trên DNA điều khiển sự biểu hiện của một số gene liên quan đến phát triển phôi như YES1, FGF4, UTF1 và ZFP [24].
Cách hoạt hóa của các gen mục tiêu OCT4 và duy trì tính đa năng vẫn chưa rõ. Bằng cách kết hợp với yếu tố đồng điều hòa khác, OCT4 có thể hoạt động vừa như một nhân tố hoạt hóa phiên mã, vừa như một nhân tố ức chế phiên mã.
2.2.2. SOX2
Miền protein của SOX2 được trình bày ở hình 2.5.
Hình 2.5: Cấu trúc miền của protein của SOX2
SOX2 là thành viên họ gen SOX (box HMG liên quan đến SRY), mã hóa nhân tố phiên mã với một miền gắn DNA HMG đơn (singer high mobility group DNA-binding domain), có vị trí 3q26.33 trên nhiễm sắc thể số 3 cánh q băng 26.33, nằm ở sợi dương, kích thước gene 2513 bp và 317 axit amin [17], [30].
Giống với OCT4, SOX2 biểu hiện trong các tế bào đa năng của phôi chuột trong giai đoạn phôi sớm, ICM, ngoại phôi bì và tế bào mầm sinh dục. Nhưng khác với OCT4, SOX2 cũng biểu hiện trong nhiều tế bào ngoại bì và phôi, và trong các tế bào tiền thân thần kinh, và quan trọng cho sự duy trì tính đồng nhất của chúng. Sự
14
biểu hiện giảm của SOX2 liên quan đến quá trình biệt hóa. Phôi chuột loại bỏ gen SOX2 sống bình thường ở giai đoạn phôi nang, nhưng chết nhanh sau khi phôi làm tổ. Các phôi này thiếu cấu trúc xi lanh trứng (egg cylinder) và thiếu các tế bào biểu mô. Khi nuôi cấy in vitro để thiết lập dòng gốc phôi, phôi nang loại bỏ gen SOX2 phát triển bình thường vào ngày đầu, nhưng sau đó biệt hóa thành tế bào tế bào túi phôi (trophectoderm) và tế bào nội mô vách. Vai trò in vitro của SOX2 là duy trì quần thể tế bào đa năng ở giai đoạn sớm của phôi [1].
Các phôi sớm biểu hiện ở mức cao các protein SOX2 có nguồn gốc từ mẹ.
Ngay trong chuột loại bỏ gen SOX2, các protein SOX2 từ mẹ vẫn được duy trì cho đến giai đoạn phôi nang. Do đó, nguyên nhân mà các phôi đột biến vẫn sống sót đến khi làm tổ có thể là do mức biểu hiện hiệu quả của SOX2 có nguồn gốc từ bố mẹ đến giai đoạn đó.
Do vậy, có thể SOX2 không cần thiết cho sự duy trì hay tạo ra tính đa năng trong các giai đoạn phôi sớm, nhưng không thể được phát hiện trong chuột bị loại bỏ bởi vì sự hiện diện của SOX2 có nguồn gốc từ mẹ. Hơn nữa, SOX2 có vai trò trong sự suy trì của các tế bào tế bào túi phôi [1].
2.2.3. KLF4
Miền protein KLF4 được trình bày ở hình 2.6.
Hình 2.6: Cấu trúc miền của protein KLF4
15
KLF4 mã hóa một loại protein thuộc họ yếu tố phiên mã Kruppel. Protein ngón tay kẽm (zinc finger protein) được mã hóa là cần thiết cho sự phát triển bình thường của chức năng bảo vệ cơ học của da, có vị trí 9q31.2, nhiễm sắc thể số 9 cánh q băng số 31.2, có kích thước gene 5,631 bp, 513 axit amin và nằm ở sợi âm.
Protein KLF4 kiểm soát quá trình chuyển đổi từ pha G1 sang pha S của chu trình tế bào sau tổn thương DNA bằng cách làm trung gian gen ức chế khối u p53. Chuột thiếu gen này có ngoại hình bình thường nhưng giảm cân nhanh chóng và chết ngay sau khi sinh do bốc hơi chất lỏng do chức năng hàng rào biểu bì bị tổn thương [29].
KLF4 có miền kích hoạt phiên mã đầu N, tiếp theo là miền ức chế phiên mã, chứa hai gốc lysine K225 và K229. Các gốc này được acetyl hóa bởi p300/CBP, tương tác với miền kích hoạt. Có một chuỗi PEST tiềm năng giữa các miền kích hoạt. Đầu C có một miền liên kết DNA chứa ba ngón tay kẽm, nhận biết và liên kết với các chuỗi mục tiêu của GC/CACCC trong nhân. Tín hiệu hướng nhân (Nuclear Localization Signal - NLS) (6 aa) nằm giữa các miền liên kết và ức chế DNA, tạo điều kiện cho việc vận chuyển KLF4 vào hạt nhân [14].
2.2.4. MYC
Cấu trúc miền protein của gen MYC được trình bày ở hình 2.7.
Hình 2.7: Cấu trúc miền protein của MYC
Họ MYC của các yếu tố sao chép dây kéo xoắn ốc xoắn ốc cơ bản bao gồm MYC, MYCN và MYCL [21]. MYC (homelocytomatosis virus oncogene homolog) đại diện cho một trong những mục tiêu thuốc được tìm kiếm nhiều nhất trong ung
16
thư. Yếu tố phiên mã MYC là một yếu tố điều hòa thiết yếu cho sự phát triển của tế bào, nhưng trong hầu hết các bệnh ung thư, nó được biểu hiện quá mức và liên quan đến kết quả kháng trị và kháng thuốc. Gen MYC dài khoảng 6 kb, được tìm thấy tại locus 8q24,21 trên nhiễm sắc thể 8 và có 439 axit amin. MYC chứa ba exon – exon 1 có kích thước lớn và không được dịch mã, tiếp theo là exon mã hóa 2 và 3, bốn trình khởi động riêng biệt - P0, P1, P2 và P3 - điều khiển phiên mã MYC, hai bộ ba mở đầu là (CTG và ATG), từ đó phát sinh hai protein MYC được biểu hiện [34].
Yếu tố phiên mã này kiểm soát sự biểu hiện của hàng trăm gen mục tiêu, nhiều trong số đó cũng là gen gây ung thư hoặc ức chế khối u và có vai trò trong sự tăng sinh tế bào và chu kỳ tế bào [9].
2.2.5. LIN28
Miền protein của LIN28 được trình bày ở hình 2.8.
Hình 2.8: Cấu trúc miền protein của LIN28
LIN28 là protein liên kết với RNA có vai trò thúc đẩy tính đa năng thông qua sự điều tiết của microRNA let-7 [25]. Ở động vật có vú, có hai loại gen LIN28 là LIN28A và LIN28B. Các gen LIN28A và LIN28B của con người có 209 và 250 axit amin [20]. LIN28 nằm ở vị trí 1p36.11 có kích thước 18,951 bp và nằm ở sợi dương [13]. Các nghiên cứu đã chỉ ra rằng LIN28A là một yếu tố đa năng của tế bào gốc. Sử dụng OCT4, SOX2, NANOG và LIN28A, các nguyên bào sợi ở người trưởng thành đã được tái lập trình lại thành công thành các tế bào gốc đa năng cảm
17
ứng [14]. Đáng chú ý, ba trong số bốn yếu tố Yamanaka sử dụng để tái lập trình có LIN28 [22].
2.2.6. GLIS1
Miền protein của GLIS1 được trình bày ở hình 2.9.
Hình 2.9: Cấu trúc miền protein của GLIS1
GLIS1 kết hợp với một số yếu tố tái lập trình khác, đã được chứng minh là làm tăng đáng kể hiệu quả của việc tạo ra các tế bào gốc vạn năng cảm ứng từ các tế bào sinh dưỡng [7]. GLIS1 có vị trí 1p32.3, kích thước 231 874 bp, 620 axit amin và nằm trên sợi âm [11]. Sự biểu hiện quá mức ban đầu của OCT3/4 (POU5F1), SOX2 và KLF4 (OSK) được sử dụng rộng rãi để tái lập trình các tế bào sinh dưỡng thành iPSC. Tuy nhiên, hiệu quả của việc tạo ra iPSC rất thấp, điều này được cho là do những khó khăn trong việc vượt qua các rào cản biểu sinh trong tế bào khởi đầu.
Sự biểu hiện của C-MYC làm tăng hiệu quả, nhưng cũng tăng cường khả năng gây khối u tiềm tàng của các tế bào biệt hóa có nguồn gốc iPSC. GLIS1 làm tăng đáng kể số lượng khuẩn lạc iPSC được tạo ra khi được biểu hiện với OSK (gọi là OSKG) trong nguyên bào sợi của người hoặc chuột [39]. Ngược lại, giảm biểu hiện GLIS1 bằng shRNA (short hairpin RNA) làm giảm hiệu suất tạo ra các khuẩn lạc iPSC do OSK gây ra trong các nguyên bào sợi chuột, cho thấy GLIS1 nội sinh có thể thúc đẩy quá trình tái lập trình qua trung gian OSK. Hơn nữa, cấy ghép gen OSKG iPSC dưới da đã hình thành các khối u có chứa các tế bào biệt hóa từ cả ba lớp mầm. Những dữ liệu này đã chứng minh rằng GLIS1 hoạt động như một công cụ thúc đẩy mạnh mẽ việc lập trình lại tế bào sinh dưỡng. Hơn nữa GLIS1 được tinh chế cùng với OCT3/4, SOX2 và KLF4 cho thấy rằng nó là một phần của phức hợp lớn hơn của các protein này [7].
Sự gia tăng hiệu quả lập trình bởi GLIS1 cũng được thể hiện bởi Yoshioka và cộng sự khi ông sử dụng một số thí nghiệm khác nhau để tạo ra iPSC sử dụng virus RNA viêm não ngựa ở Venezuela (Venezuelan equine encephalitis)
18
đã biểu hiện OCT4, SOX2, KLF4 và GLIS1 (OSKG) [42]. Các nghiên cứu gần đây đã chứng minh rằng GLIS1 biểu hiện trong một số quần thể tế bào gốc và tế bào tiền thân, cho thấy vai trò có thể có của các protein này trong việc điều hòa duy trì, biệt hóa hoặc tự đổi mới của các tế bào này [7].