3.2.1. Xác định chức năng
Bộ gen hoàn chỉnh của các sinh vật với kích thƣớc hàng triệu cặp có thể nhanh chóng đƣợc phân tích. Các chuỗi gen hoàn chỉnh này có thể dùng để xây dựng mạng trao đổi chất, tuy nhiên chúng ta vẫn cần phải tiến hành nhiều bƣớc trƣớc khi có đƣợc kết quả mong muốn[19-21].
Bƣớc đầu tiên để xây dựng mạng trao đổi chất là xác định chức năng của từng đoạn gen. Khi chúng ta xem xét bộ gen, có thể có nhiều gen cùng đƣợc gán cho một chức năng. Hy vọng trong thời gian tới sẽ có những phƣơng pháp giúp chúng ta nhanh chóng xác định chức năng tƣơng ứng của một gen.
3.2.2. Cơ sở dữ liệu các phản ứng trao đổi chất
Các nhà khoa học đã xây dựng một cơ sở dữ liệu về các phản ứng trao đổi chất đã biết của E. coli [22-24]. Cơ sở dữ liệu này chứa các thông tin nhƣ: các
chất nền, các chất sinh ra, ma trận stoichiometry của mỗi phản ứng trao đổi chất, tên của các enzyme xúc tác cho các phản ứng, các gen mã hoá cho các enzyme đó và số EC của mỗi phản ứng. Bảng 3.1 minh hoạ một phần của cơ sở dữ liệu này.
Bảng 3.1 Danh sách một số phản ứng trao đổi chất của E. coli [50].
EMP Pathway 2.7.1.56
Tagatose-6-phosphate kinase
agaZ TAG6P + ATP TAG16P + ADP 2.7.1.- Tagatose-bisphosphate aldolase 2 gatY TAG16P T3P2 + T3P1 4.1.2.- Tagatose-bisphosphate aldolase 1 agaY TAG16P T3P2 + T3P1 4.1.2.- Glycerol
Glycerol kinase glpK GL + ATP GL3P + ADP 2.7.1.30 Glycerol-3-phosphate- dehydrogenase- [NAD(P)+] gpsA GL3P + NADP T3P2 + NADPH 1.1.1.94 Nucleosides and Deoxynucleosides Phosphopentomutase deoB DR1P DR5P 5.4.2.7 Phosphopentomutase deoB R1P R5P 5.4.2.7 Deoxyribose-phosphate aldolase deoC DR5P ACAL + T3P1 4.1.2.4
Biosynthesis
Asparate transaminase aspC OA + GLU ASP + AKG 2.6.1.1 Asparagine synthetase
(Glutamate dependent)
asnB ASP + ATP + GLN GLU + ASN + AMP + PPI
6.3.5.4
Aspartate-ammonia ligase
asnA ASP + ATP + NH3 ASN + AMP + PPI
6.3.1.1
Glutamate and Glutamine Biosynthesis
Glutamate dehydrogenase
gdhA AKG + NH3 + NADPH GLU + NADP
1.4.1.4
Glutamate-ammonia ligase
glnA GLU + NH3 + ATP GLN + ADP + PI
6.3.1.2
Glutamate synthase gltBD AKG + GLN + NADPH NADP + 2 GLU
1.4.1.13
3.2.3. Xây dựng mô hình giả lập mạng trao đổi chất
Tất cả các gen trao đổi chất trong tế bào là một tập con của bộ gen. Tập con này đƣợc gọi là là kiểu gen trao đổi chất của một sinh vật, và mô hinh giả lập của kiểu gen trao đổi chất đƣợc gọi là kiểu gen trao đổi chất giả lập. Sản phẩm của gen trao đổi chất là xúc tác của toàn bộ các phản ứng và quá trình vận chuyển bên trong tế bào. Ví dụ, kiểu gen trao đổi chất giả lập của E. coli bao
gồm các gen liên quan đến quá trinh trao đổi chất trung tâm, quá trinh trao đổi amino acid, nucleotide, axid béo, lipid, carbohydrate, tổng hợp vitamin, sản sinh năng lƣợng và các đại phân tử (ví dụ nhƣ peptidoglycan, glycogen, RNA, DNA). Hình 3.1 minh hoạ một kiểu gen trao đổi chất. Hình 3.2, 3.3 minh hoạ một mạng trao đổi chất và ma trận stoichiometry tƣơng ứng.
Hình 3.1 Minh hoạ một kiểu gen trao đổi chất [50].
Hình 3.3 Minh hoạ ma trận stoichiometry [50].
Phƣơng pháp đơn giản để xây dựng kiểu gen trao đổi chất của E. coli nhƣ
sau. Đầu tiên, tìm trong cơ sở dữ liệu những chuỗi gen đã đƣợc chú giải của E. coli. Quá trình này chọn ra tất cả các phản ứng trao đổi chất từ cơ sở dữ liệu.
Tuy nhiên vẫn còn các gen trao đổi chất không tìm thấy trong cơ sở dữ liệu hiện tại và sẽ đƣợc đánh dấu để tìm kiếm tiếp ở các cơ sở dữ liệu khác.
Tại thời điểm hiện tại, vẫn còn một số gen/phản ứng của E. coli chƣa đƣợc đƣa vào kiểu gen trao đổi chất, một nguyên nhân là do chƣa xác định đƣợc gen thực hiện các phản ứng đó.
3.3. Phân tích mạng trao đổi chất
Tất cả các thông tin về ma trận Stoichiometry của các phản ứng trao đổi chất có thể sử dụng để mô phỏng mạng. Và chúng ta cũng biết rằng vấn đề mô hình hoá các chức năng của tế bào vẫn là rất khó. Tuy nhiên, với một danh sách hoàn chỉnh các phân tử trong tế bào, chúng ta có thể giới hạn các hoạt động của tế bào và xác định khả năng của mạng. Năng lực của mạng có thể đƣợc phân tích và các đặc tính tối ƣu có thể đƣợc xác định. Tiếp theo chúng ta sẽ nghiên cứu qua về các phƣơng pháp phân tích mạng trao đổi chất.
3.3.1. Phân tich cân bằng dòng (Flux balance analysis - FBA)
Phƣơng pháp cơ bản và hiệu quả để phân tích mạng trao đổi chất. Chi tiết về phƣơng pháp sẽ đƣợc trình bày ở chƣơng tiếp theo.
3.3.2. Xây dựng các đƣờng phản ứng trao đổi chất
Quá trình xác định các chức năng gen dựa hoàn toàn trên việc so sánh chuỗi thƣờng đƣa ra các tập đƣờng phản ứng (pathway) không hoàn chỉnh. Tuy nhiên, việc xây dựng một đƣờng phản ứng giúp chúng ta có cái nhìn toàn diện về mạng [19, 20. 25, 26].
Các đƣờng phản ứng tìm đƣợc sẽ đƣợc kiểm tra bằng cách so sánh với các hành động và yêu cầu dinh dƣỡng của E. coli đã xác định từ thực nghiệm.
CHƢƠNG 4 - CÁC PHƢƠNG PHÁP PHÂN TÍCH MẠNG TRAO ĐỔI CHẤT
4.1. Các phƣơng pháp phân tích với dạng wild-type (dạng tự nhiên) 4.1.1. Phân tích cân bằng dòng (Flux Balance Analysis – FBA) 4.1.1. Phân tích cân bằng dòng (Flux Balance Analysis – FBA)
Với các giả thiết nhƣ đã trình bày ở chƣơng 1 ta có mô hình toán học để nghiên cứu mạng trao đổi chất là hệ phƣơng trình sau:
0 low high S v v v v (4.1)
Do hệ phƣơng trình (4.1) có số ẩn nhiều hơn số phƣơng trình (ma trận S có số cột nhiều hơn số dòng) nên sẽ có vô số nghiệm. Tập các nghiệm của hệ phƣơng trình (4.1) đƣợc gọi là không gian khả thi Φ. Minh hoạ cho Φ có thể thấy trong hình 4.1 nhƣ là một hình nón. Tuy nhiên chỉ có rất ít nghiệm trong Φ
là có ý nghĩa sinh học. Một cách đơn giản để giới hạn số nghiệm của hệ phƣơng trình (4.1) là đƣa thêm các điều kiện ràng buộc cho các giá trị dòng. Các dòng bên trong đã có ràng buộc từ thực nghiệm, vì vậy ngƣời ta hay đƣa thêm các ràng buộc cho các dòng bên ngoài. Các ràng buộc này thƣờng phụ thuộc vào cấu tạo của tế bào, môi trƣờng, các chất nền hay tốc độ truyền dẫn các chất nển.
Hình 4.1 Không gian dòng của một mạng trao đổi chất có thể biểu diễn nhƣ một hình nón.
Nhƣ đã trình bày ở trên, do thiếu các tham số đƣợc xác định qua thực nghiệm để mô tả quá trình cân bằng động của mạng trao đổi chất, nên cần có một cách tiếp cận khác để nghiên cứu về khả năng của nó. Phƣơng pháp Phân tích cân bằng dòng (Flux Balance Analysis - FBA) đã đƣợc phát triển cho mục đích này [41]. Nó đã đƣợc chứng minh là có hiệu quả để xác định khả năng của mạng cũng nhƣ có thể dự đoán tốc độ tăng trƣởng của các sinh vật nhƣ E. Coli, nấm men, ... Phƣơng pháp FBA đạt đƣợc điều này bằng cách thêm một giả sử: các mạng trao đổi chất luôn tối ƣu theo một hàm mục tiêu xác định Z. Hàm mục tiêu là một hàm tuyến tính mà ta sẽ nghiên cứu ở phần tiếp theo. Tuỳ thuộc vào từng hàm mục tiêu, một tập các lời giải tối ƣu sẽ tìm đƣợc trong Φ. Khi áp dụng FBA vào E. coli, hàm mục tiêu chính là hàm tăng trƣởng tuyến tính mà ở đó tốc độ phát triển của vi khuẩn là tối đa. Từ đó chúng ta có công thức cho phƣơng pháp FBA nhƣ sau: high low T v v v v S v c 0 : Subject to : Maximize (4.2)
trong đó cT là chuyển vị của hàm mục tiêu tuyến tính và các ký hiệu khác nhƣ đã định nghĩa.
4.1.2. Xác định hàm mục tiêu trong phƣơng pháp FBA
Chúng ta muốn chọn hàm mục tiêu Z có ý nghĩa sinh học, một số hàm mục tiêu có thể là: Tối đa tốc độ phát triển, Tối đa nồng độ một chất, Tối thiểu năng lƣợng sử dụng. Hình 4.2 minh hoạ một mạng trao đổi chất và hàm mục tiêu của nó:
Hình 4.2 Minh hoạ hàm mục tiêu của một mạng trao đổi chất: Z=B+D+2E
Các nghiên cứu gần đây của Edwards [39], Schilling và Segre [4] cho thấy rằng chúng ta nên sử dụng hàm Z là hàm tối đa tăng trƣởng. Nghiên cứu chi tiết về hàm mục tiêu có thể xem trong tài liệu tham khảo về phƣơng pháp BOSS [27].
4.2. Các phƣơng pháp phân tích với dạng đột biến (bị xoá bỏ gen) 4.2.1. Khái quát về xoá bỏ gen (Gene Knockouts hay Mutant) 4.2.1. Khái quát về xoá bỏ gen (Gene Knockouts hay Mutant)
Các hiệu ứng xảy ra khi một gen bị xoá bỏ là: Gen bị xoá -> Enzyme tƣơng ứng bị xoá -> Các phản ứng cần có enzyme xúc tác sẽ bị xoá -> Các cạnh tƣơng ứng trong mạng bị xoá -> Các dòng tƣơng ứng bị xoá (các vi tƣơng ứng bằng 0). Hình 4.3 cho ta thấy một ví dụ về việc gen bị xoá bỏ -> thay đổi mạng trao đổi chất.
Hình 4.3 Mô hình xoá bỏ gen [8].
4.2.2. Cực tiểu hoá điều chỉnh trao đổi chất (Minimization Of Metabolic Adjustment - MOMA) Adjustment - MOMA)
4.2.2.1.Giới thiệu phƣơng pháp MOMA
Những công trình nghiên cứu gần đây của Segre [4] và cộng sự đã giới thiệu ý tƣởng về phƣơng pháp điều chỉnh trao đổi tối thiểu (MOMA) cho một mạng trao đổi chất với gen bị xoá bỏ dựa trên giả thuyết rằng: khi không có quá trình tiến hoá và thích nghi lâu dài, một cơ thể đột biến có thể không phát triển tối ƣu, nhƣng có thể điều chỉnh các dòng phân phối càng gần với dạng tự nhiên
càng tốt. Nói cách khác phân phối dòng sau khi gen bị xoá bỏ tiến gần tới dạng tự nhiên theo khoảng cách Euclid. Hình 4.4 minh hoạ cho ý tƣởng này:
Hình 4.4 Nguyên lý tối ƣu của FBA và MOMA [4].
Một lƣợc đồ 2 chiều thể hiện không gian khả thi của dạng tự nhiên (ΦWT) và dạng đột biến dòng j (Φ j) đƣợc thể hiện bởi các đa giác màu xanh và vàng. Nghiệm của FBA là điểm tối đa hàm mục tiêu (đƣờng màu đỏ). Một dự đoán tối ƣu của FBA có thể dùng cho cả dạng tự nhiên (a) và dạng đột biến (b). Nghiệm đột biến của MOMA (c) tính bằng QP có thể xem nhƣ là phép chiếu vuông góc nghiệm FBA xuống không gian khả thi của dạng đột biến (Φ j). Nghiệm đột biến của FBA và MOMA nói chung là khác nhau.
Hình 4.5 Minh hoạ nghiệm của phƣơng pháp MOMA trên không gian nhiều chiều.
Nền tảng toán học cần thiết để đạt đƣợc mục tiêu là phép chiếu vuông góc nghiệm tự nhiên w xuống không gian khả thi Φm của dạng đột biến, biến đổi toán học đƣợc trình bày dƣới đây:
Giả sử:
w – vector giá trị dòng tối ƣu của dạng tự nhiên. v – vector giá trị dòng trong không gian đột biến.
Ta cần tìm v thoả mãn khoảng cách Euclidian giữa v và w là tối thiểu: Min f(v) = (v-w)T *( v-w)
<=> Min v2-2vw+w2
<=> Min v2-2vw vì w là hằng số <=> Min 0.5v 2- wv
<=> Min 0.5vT*I*v+L*v với I là ma trận dơn vị và L = -w,
Bài toán đƣợc biến đổi về dạng quy hoạch bậc hai, kết hợp với các ràng buộc nhƣ đã trinh bày chúng ta có công thức cho phƣơng pháp MOMA nhƣ sau:
0 0 : Subject to 2 1 : Minimize i high low T T v v v v v S v w v I v (4.3)
trong đó I là ma trận đơn vị, là chuyển vị của lời giải nguyên thuỷ tính đƣợc bằng FBA (hệ phƣơng trình 4.2) và “i” là chỉ số của gen bị loại bỏ. Các kết quả thực nghiệm đã chứng minh rằng với cơ thể đột biến thì MOMA cho kết quả dự đoán tốc độ phát triển của E. coli tốt hơn FBA.
Hình 4.6 Một minh hoạ cho các đƣờng phản ứng (pathway) của mạng carbon trung tâm của E. coli, màu sắc đƣợc sử dụng để phân biệt các pathway khác nhau [4].
Gen đột biến là tpiA, một trong 3 gen đƣợc dự đoán chính xác bởi MOMA (FBA không dự đoán đƣợc). Mỗi điểm là một giá trị dòng trong mạng đột biến tpiA, màu sắc khác nhau tƣơng ứng với các pathway khác nhau. Giá trị trên mỗi trục toạ độ tƣơng ứng với sự thay đổi của giá trị dự đoán khi đột biến bởi hai phƣơng pháp so với giá trị khi ở dạng tự nhiên. Chúng ta có thể thấy các điểm xanh lục tăng đáng kể với FBA trong khi không thay đổi với MOMA.
4.2.2.2.So sánh FBA và MOMA
Kết quả dự đoán phân phối dòng của MOMA và FBA của cùng một dạng đột biến cho thấy các kết quả nhƣ hình 4.8.
Hình 4.8 Kết quả dự đoán phân phối dòng của MOMA và FBA [4] .
Hình 4.8 cho thấy sự so sánh dự đoán đột biến gen pyk giữa FBA và MOMA. Các giá trị dòng thể hiện tỷ lệ phần trăm dòng glucose hấp thụ. A–C; D–F; G–I là kết quả với các điều kiện khác nhau. Với mỗi điều kiện, dự đoán
dạng tự nhiên của FBA (A, D, G) đƣợc so sánh với kết quả thực nghiệm tại đoạn JM101. Dự đoán dạng đột biến gen pyk của FBA (B, E, H) và MOMA (C, F, I) cũng đƣợc so sánh với thực nghiệm đột biến đoạn PB25. Màu sắc khác nhau tƣơng ứng với các pathways khác nhau
4.2.3. Cực tiểu hoá thay đổi điều hoà (Regulatory On/Off Minimization - ROOM) ROOM)
4.2.3.1.Giới thiệu về ROOM
Tối thiểu hoá thay đổi điều hoà (ROOM) là một mô hình dùng để dự đoán hành động của mạng trao đổi chất khi gen bị loại bỏ. Nó dựa vào việc tối thiểu hoá số lƣợng của các thay đổi dòng đáng kể so với dạng nguyên thuỷ. ROOM có cùng ý tƣởng nhƣ MOMA nhƣng sử dụng một độ đo khoảng cách khác so với MOMA dùng khoảng cách Euclid. Ngoài ra ROOM còn có khả năng xác định chính xác các đƣờng dẫn khác cho các phản ứng liên kết với các gen bị loại bỏ, điều này càng làm tăng tính tin cậy sinh học của ROOM. ROOM cũng tốt hơn MOMA trong việc dự đoán các dòng trong tế bào và khả năng sát thân của E. coli khi bị đột biến loại bỏ gen.
Một thách thức khác là việc dự đoán tính sát thân và kiểu hình của sinh vật sau khi xóa bỏ gen. Nhƣ đã trình bày trong nghiên cứu của Segre (2002) [4], giả thiết hành động tối ƣu của sinh vật bị xoá bỏ gen có thể không phản ánh chính xác các hành động trong thực tế. Thay vào đó, Segre gợi ý rằng các sinh vật đó điều chỉnh bằng cách tối thiểu hoá các thay đổi phân phối dòng của nó nhƣ cách tiếp cận của MOMA. Phƣơng pháp này cực tiểu theo tiêu chuẩn Euclid của sai khác dòng giữa các mạng trao đổi chất của sinh vật nguyên thuỷ và các dạng đột biến. MOMA đƣợc ghi nhận dự đoán thành công tính sát thân và giá trị dòng trao đổi chất của mạng đột biến của E. coli.
FBA giả thiết về tốc độ phát triển tối ƣu còn MOMA sử dụng độ đo Euclid nhƣng đều không phản ánh chính xác các điều chỉnh của mạng trao đổi chất sau đột biến. Nhƣợc điểm này là do độ đo Euclid có thể ngăn cản các thay đổi lớn của các dòng đơn. Các thay đổi lớn có thể cần để chuyển hƣớng dòng sang các đƣờng phản ứng khác và có thể thấy đƣợc trong thực nghiệm.
Chúng tôi đề nghị thay thế độ đo khoảng cách trong MOMA bằng cực tiểu hoá trạng thái lân cận. Phƣơng pháp mới của chúng tôi, ROOM đơn giản cực tiểu hoá số lƣợng các thay đổi dòng đáng kể. Đặc biệt, ROOM tìm kiếm phân phối dòng cho một giống đột biến mà thoả mãn các ràng buộc ma trận hệ số cân bằng, nhiệt động lực học và hiệu suất dòng, trong khi cực tiểu số lƣợng thay đổi dòng đáng kể so với dạng nguyên thuỷ. ROOM cải tiến dự đoán dòng trao đổi
chất tế bào của E. coli so với MOMA. ROOM cũng dự đoán tốt hơn MOMA về tính sát thân của men bia khi bị xoá bỏ gen ở mức độ lớn.