4.1.1. Phân tích cân bằng dòng (Flux Balance Analysis – FBA)
Với các giả thiết nhƣ đã trình bày ở chƣơng 1 ta có mô hình toán học để nghiên cứu mạng trao đổi chất là hệ phƣơng trình sau:
0 low high S v v v v (4.1)
Do hệ phƣơng trình (4.1) có số ẩn nhiều hơn số phƣơng trình (ma trận S có số cột nhiều hơn số dòng) nên sẽ có vô số nghiệm. Tập các nghiệm của hệ phƣơng trình (4.1) đƣợc gọi là không gian khả thi Φ. Minh hoạ cho Φ có thể thấy trong hình 4.1 nhƣ là một hình nón. Tuy nhiên chỉ có rất ít nghiệm trong Φ
là có ý nghĩa sinh học. Một cách đơn giản để giới hạn số nghiệm của hệ phƣơng trình (4.1) là đƣa thêm các điều kiện ràng buộc cho các giá trị dòng. Các dòng bên trong đã có ràng buộc từ thực nghiệm, vì vậy ngƣời ta hay đƣa thêm các ràng buộc cho các dòng bên ngoài. Các ràng buộc này thƣờng phụ thuộc vào cấu tạo của tế bào, môi trƣờng, các chất nền hay tốc độ truyền dẫn các chất nển.
Hình 4.1 Không gian dòng của một mạng trao đổi chất có thể biểu diễn nhƣ một hình nón.
Nhƣ đã trình bày ở trên, do thiếu các tham số đƣợc xác định qua thực nghiệm để mô tả quá trình cân bằng động của mạng trao đổi chất, nên cần có một cách tiếp cận khác để nghiên cứu về khả năng của nó. Phƣơng pháp Phân tích cân bằng dòng (Flux Balance Analysis - FBA) đã đƣợc phát triển cho mục đích này [41]. Nó đã đƣợc chứng minh là có hiệu quả để xác định khả năng của mạng cũng nhƣ có thể dự đoán tốc độ tăng trƣởng của các sinh vật nhƣ E. Coli, nấm men, ... Phƣơng pháp FBA đạt đƣợc điều này bằng cách thêm một giả sử: các mạng trao đổi chất luôn tối ƣu theo một hàm mục tiêu xác định Z. Hàm mục tiêu là một hàm tuyến tính mà ta sẽ nghiên cứu ở phần tiếp theo. Tuỳ thuộc vào từng hàm mục tiêu, một tập các lời giải tối ƣu sẽ tìm đƣợc trong Φ. Khi áp dụng FBA vào E. coli, hàm mục tiêu chính là hàm tăng trƣởng tuyến tính mà ở đó tốc độ phát triển của vi khuẩn là tối đa. Từ đó chúng ta có công thức cho phƣơng pháp FBA nhƣ sau: high low T v v v v S v c 0 : Subject to : Maximize (4.2)
trong đó cT là chuyển vị của hàm mục tiêu tuyến tính và các ký hiệu khác nhƣ đã định nghĩa.
4.1.2. Xác định hàm mục tiêu trong phƣơng pháp FBA
Chúng ta muốn chọn hàm mục tiêu Z có ý nghĩa sinh học, một số hàm mục tiêu có thể là: Tối đa tốc độ phát triển, Tối đa nồng độ một chất, Tối thiểu năng lƣợng sử dụng. Hình 4.2 minh hoạ một mạng trao đổi chất và hàm mục tiêu của nó:
Hình 4.2 Minh hoạ hàm mục tiêu của một mạng trao đổi chất: Z=B+D+2E
Các nghiên cứu gần đây của Edwards [39], Schilling và Segre [4] cho thấy rằng chúng ta nên sử dụng hàm Z là hàm tối đa tăng trƣởng. Nghiên cứu chi tiết về hàm mục tiêu có thể xem trong tài liệu tham khảo về phƣơng pháp BOSS [27].
4.2. Các phƣơng pháp phân tích với dạng đột biến (bị xoá bỏ gen) 4.2.1. Khái quát về xoá bỏ gen (Gene Knockouts hay Mutant) 4.2.1. Khái quát về xoá bỏ gen (Gene Knockouts hay Mutant)
Các hiệu ứng xảy ra khi một gen bị xoá bỏ là: Gen bị xoá -> Enzyme tƣơng ứng bị xoá -> Các phản ứng cần có enzyme xúc tác sẽ bị xoá -> Các cạnh tƣơng ứng trong mạng bị xoá -> Các dòng tƣơng ứng bị xoá (các vi tƣơng ứng bằng 0). Hình 4.3 cho ta thấy một ví dụ về việc gen bị xoá bỏ -> thay đổi mạng trao đổi chất.
Hình 4.3 Mô hình xoá bỏ gen [8].
4.2.2. Cực tiểu hoá điều chỉnh trao đổi chất (Minimization Of Metabolic Adjustment - MOMA) Adjustment - MOMA)
4.2.2.1.Giới thiệu phƣơng pháp MOMA
Những công trình nghiên cứu gần đây của Segre [4] và cộng sự đã giới thiệu ý tƣởng về phƣơng pháp điều chỉnh trao đổi tối thiểu (MOMA) cho một mạng trao đổi chất với gen bị xoá bỏ dựa trên giả thuyết rằng: khi không có quá trình tiến hoá và thích nghi lâu dài, một cơ thể đột biến có thể không phát triển tối ƣu, nhƣng có thể điều chỉnh các dòng phân phối càng gần với dạng tự nhiên
càng tốt. Nói cách khác phân phối dòng sau khi gen bị xoá bỏ tiến gần tới dạng tự nhiên theo khoảng cách Euclid. Hình 4.4 minh hoạ cho ý tƣởng này:
Hình 4.4 Nguyên lý tối ƣu của FBA và MOMA [4].
Một lƣợc đồ 2 chiều thể hiện không gian khả thi của dạng tự nhiên (ΦWT) và dạng đột biến dòng j (Φ j) đƣợc thể hiện bởi các đa giác màu xanh và vàng. Nghiệm của FBA là điểm tối đa hàm mục tiêu (đƣờng màu đỏ). Một dự đoán tối ƣu của FBA có thể dùng cho cả dạng tự nhiên (a) và dạng đột biến (b). Nghiệm đột biến của MOMA (c) tính bằng QP có thể xem nhƣ là phép chiếu vuông góc nghiệm FBA xuống không gian khả thi của dạng đột biến (Φ j). Nghiệm đột biến của FBA và MOMA nói chung là khác nhau.
Hình 4.5 Minh hoạ nghiệm của phƣơng pháp MOMA trên không gian nhiều chiều.
Nền tảng toán học cần thiết để đạt đƣợc mục tiêu là phép chiếu vuông góc nghiệm tự nhiên w xuống không gian khả thi Φm của dạng đột biến, biến đổi toán học đƣợc trình bày dƣới đây:
Giả sử:
w – vector giá trị dòng tối ƣu của dạng tự nhiên. v – vector giá trị dòng trong không gian đột biến.
Ta cần tìm v thoả mãn khoảng cách Euclidian giữa v và w là tối thiểu: Min f(v) = (v-w)T *( v-w)
<=> Min v2-2vw+w2
<=> Min v2-2vw vì w là hằng số <=> Min 0.5v 2- wv
<=> Min 0.5vT*I*v+L*v với I là ma trận dơn vị và L = -w,
Bài toán đƣợc biến đổi về dạng quy hoạch bậc hai, kết hợp với các ràng buộc nhƣ đã trinh bày chúng ta có công thức cho phƣơng pháp MOMA nhƣ sau:
0 0 : Subject to 2 1 : Minimize i high low T T v v v v v S v w v I v (4.3)
trong đó I là ma trận đơn vị, là chuyển vị của lời giải nguyên thuỷ tính đƣợc bằng FBA (hệ phƣơng trình 4.2) và “i” là chỉ số của gen bị loại bỏ. Các kết quả thực nghiệm đã chứng minh rằng với cơ thể đột biến thì MOMA cho kết quả dự đoán tốc độ phát triển của E. coli tốt hơn FBA.
Hình 4.6 Một minh hoạ cho các đƣờng phản ứng (pathway) của mạng carbon trung tâm của E. coli, màu sắc đƣợc sử dụng để phân biệt các pathway khác nhau [4].
Gen đột biến là tpiA, một trong 3 gen đƣợc dự đoán chính xác bởi MOMA (FBA không dự đoán đƣợc). Mỗi điểm là một giá trị dòng trong mạng đột biến tpiA, màu sắc khác nhau tƣơng ứng với các pathway khác nhau. Giá trị trên mỗi trục toạ độ tƣơng ứng với sự thay đổi của giá trị dự đoán khi đột biến bởi hai phƣơng pháp so với giá trị khi ở dạng tự nhiên. Chúng ta có thể thấy các điểm xanh lục tăng đáng kể với FBA trong khi không thay đổi với MOMA.
4.2.2.2.So sánh FBA và MOMA
Kết quả dự đoán phân phối dòng của MOMA và FBA của cùng một dạng đột biến cho thấy các kết quả nhƣ hình 4.8.
Hình 4.8 Kết quả dự đoán phân phối dòng của MOMA và FBA [4] .
Hình 4.8 cho thấy sự so sánh dự đoán đột biến gen pyk giữa FBA và MOMA. Các giá trị dòng thể hiện tỷ lệ phần trăm dòng glucose hấp thụ. A–C; D–F; G–I là kết quả với các điều kiện khác nhau. Với mỗi điều kiện, dự đoán
dạng tự nhiên của FBA (A, D, G) đƣợc so sánh với kết quả thực nghiệm tại đoạn JM101. Dự đoán dạng đột biến gen pyk của FBA (B, E, H) và MOMA (C, F, I) cũng đƣợc so sánh với thực nghiệm đột biến đoạn PB25. Màu sắc khác nhau tƣơng ứng với các pathways khác nhau
4.2.3. Cực tiểu hoá thay đổi điều hoà (Regulatory On/Off Minimization - ROOM) ROOM)
4.2.3.1.Giới thiệu về ROOM
Tối thiểu hoá thay đổi điều hoà (ROOM) là một mô hình dùng để dự đoán hành động của mạng trao đổi chất khi gen bị loại bỏ. Nó dựa vào việc tối thiểu hoá số lƣợng của các thay đổi dòng đáng kể so với dạng nguyên thuỷ. ROOM có cùng ý tƣởng nhƣ MOMA nhƣng sử dụng một độ đo khoảng cách khác so với MOMA dùng khoảng cách Euclid. Ngoài ra ROOM còn có khả năng xác định chính xác các đƣờng dẫn khác cho các phản ứng liên kết với các gen bị loại bỏ, điều này càng làm tăng tính tin cậy sinh học của ROOM. ROOM cũng tốt hơn MOMA trong việc dự đoán các dòng trong tế bào và khả năng sát thân của E. coli khi bị đột biến loại bỏ gen.
Một thách thức khác là việc dự đoán tính sát thân và kiểu hình của sinh vật sau khi xóa bỏ gen. Nhƣ đã trình bày trong nghiên cứu của Segre (2002) [4], giả thiết hành động tối ƣu của sinh vật bị xoá bỏ gen có thể không phản ánh chính xác các hành động trong thực tế. Thay vào đó, Segre gợi ý rằng các sinh vật đó điều chỉnh bằng cách tối thiểu hoá các thay đổi phân phối dòng của nó nhƣ cách tiếp cận của MOMA. Phƣơng pháp này cực tiểu theo tiêu chuẩn Euclid của sai khác dòng giữa các mạng trao đổi chất của sinh vật nguyên thuỷ và các dạng đột biến. MOMA đƣợc ghi nhận dự đoán thành công tính sát thân và giá trị dòng trao đổi chất của mạng đột biến của E. coli.
FBA giả thiết về tốc độ phát triển tối ƣu còn MOMA sử dụng độ đo Euclid nhƣng đều không phản ánh chính xác các điều chỉnh của mạng trao đổi chất sau đột biến. Nhƣợc điểm này là do độ đo Euclid có thể ngăn cản các thay đổi lớn của các dòng đơn. Các thay đổi lớn có thể cần để chuyển hƣớng dòng sang các đƣờng phản ứng khác và có thể thấy đƣợc trong thực nghiệm.
Chúng tôi đề nghị thay thế độ đo khoảng cách trong MOMA bằng cực tiểu hoá trạng thái lân cận. Phƣơng pháp mới của chúng tôi, ROOM đơn giản cực tiểu hoá số lƣợng các thay đổi dòng đáng kể. Đặc biệt, ROOM tìm kiếm phân phối dòng cho một giống đột biến mà thoả mãn các ràng buộc ma trận hệ số cân bằng, nhiệt động lực học và hiệu suất dòng, trong khi cực tiểu số lƣợng thay đổi dòng đáng kể so với dạng nguyên thuỷ. ROOM cải tiến dự đoán dòng trao đổi
chất tế bào của E. coli so với MOMA. ROOM cũng dự đoán tốt hơn MOMA về tính sát thân của men bia khi bị xoá bỏ gen ở mức độ lớn.
Kinh nghiệm tăng cƣờng của khoảng cách ROOM dựa trên ý tƣởng:
Các thay đổi điều hoà gen để thay đổi dòng sau khi gen bị xoá bỏ đƣợc cực tiểu hoá bởi tế bào khi cố gắng cực tiểu hoá chi phí thích nghi.
Những thay đổi điều hoà này có thể miêu tả bởi các giá trị on/off. ROOM hoàn toàn mô tả các thay đổi dòng bằng cách xác định các thay đổi dòng đáng kể.
4.2.3.2.Phƣơng pháp ROOM
ROOM tìm kiếm một phân phối dòng thoả mãn cùng ràng buộc nhƣ FBA trong khi cực tiểu hoá số lƣợng thay đổi dòng đáng kể. Chúng ta chỉ tính các thay đổi dòng đáng kể vì luôn tồn tại các nhiễu cố hữu trong các hệ thống sinh học và cũng là để giảm thời gian xử lý. Chúng ta dùng MILP nhƣ sau:
Minimize yi i1 m subject to Sv = 0 vmin v vmax vj 0,j A vi yi(vmax,iwiu)wiu (*) vi yi(vmin,i wil) wil (**) yi {0,1} (***) wiu wiwi wil wiwi
với mỗi dòng i, 1<= i <= m, yi = 1 nếu vi có thay đổi dòng đáng kể và yi = 0 trong trƣờng hợp còn lại, wu
and wl là các ngƣỡng để xác định thay đổi dòng, với
δ, ε là các khoảng dung sai tƣơng đối và tuyệt đối tƣơng ứng với w và A trong MOMA.
Thật vậy, với yi = 1, bất đẳng thức (*) và (**) không tạo ra ràng buộc mới
với vi, trong khi nếu yi = 0 thì đó là các ràng buộc mới. Kích thƣớc của δ, ε ảnh hƣởng đến thời gian chạy của thuật toán MILP; chúng tôi chọn các giá trị nhỏ nhất mà vẫn có kết quả trong thời gian có thể chấp nhận. (Đặc biệt, chúng tôi
chọn δ = 0.03, ε =0.001 để dự đoán dòng và δ = 0.1, ε =0.01 để dự đoán tính sát thân). Sự lựa chọn các tham số ảnh hƣởng đến kết quả phân phối dòng của giải thuật bởi nó cho phép cộng (δ) và nhân (ε) một lƣợng nhỏ dòng để điều chỉnh các đƣờng thay thế mà không mất chi phí. Thời gian chạy với bài toán MILP chỉ là vài giây.
Khi bỏ qua các ràng buộc số nguyên trong (***) thành 0<=yi <=1 thì bài toán trở thành biến thể của quy hoạch tuyến tính. Với biến thể này, các tham số δ, ε đƣợc cho bằng 0. Dự đoán dựa trên biến thể LP của ROOM cũng khá chính xác dù kém hơn so với ROOM ban đầu. Công thức MILP dùng để dự đoán dòng của E. coli và dự đoán tính sát thân của men, trong khi LP dùng để dự đoán tính sát thân và tốc độ phát triển của E. coli. Điều thú vị là công thức LP của ROOM đôi khi tƣơng tự với một biến thể của MOMA.
4.2.3.3.So sánh MOMA và ROOM
Dự đoán dòng
Các số liệu dòng trao đổi chất của E. coli bị xoá gen có trong báo cáo của Emmerling [17]. Bộ sƣu tập 17 dòng nội bào trong mạng trao đổi chất carbon trung tâm của E. coli đƣợc xác định theo kinh nghiệm bằng cách kết hợp quang phổ NMR trong các thí nghiệm đánh dấu bằng 13C (đồng vị carbon) và các số liệu sinh lý học (xem thêm ở tài liệu tham khảo). Các dòng của cả dạng nguyên thuỷ (JM101) và dạng đột biến pyk (PB25) đều đƣợc đo với 3 điều kiện phát
triển khác nhau để cho ra sáu tập kết quả. Hai điều kiện hạn chế glucose đƣợc dùng (nồng độ thấp / cao) và một điều kiện hạn chế nitrogen (nitơ).
Để mô hình hoá dạng đột biến pyk (PB25, pykA::kan pykF::cat), hai phản ứng từ Phosphoenolpyruvate (PEP) tới Pyruvate (PYR) đƣợc đặt bằng không.
Trong báo cáo của Segre (2002) [4] đã so sánh dự đoán của FBA và MOMA với tập hợp các dòng thực nghiệm này. Với dạng hoang dã FBA dự đoán tốt trong cả 3 trƣờng hợp, trong khi với dạng đột biến pyk kết quả dự đoán tồi cho cả 2 trƣờng hợp môi trƣờng glucose thấp và nitrogen thấp. MOMA dự đoán cho dạng đột biến tốt hơn nhiều so với FBA.
Dự đoán của ROOM cho dạng đột biến pyk chính xác hơn đáng kể so với FBA và MOMA. Với cả 2 thí nghiệm glucose thấp và nitrogen hạn chế, độ tƣơng quan của ROOM với dữ liệu dòng thực nghiệm cao hơn 12% so với MOMA (Hình 4.10A). Hình 4.10 B,C so sánh độ chính xác dự đoán của MOMA và ROOM.
Hình 4.9 So sánh FBA, MOMA và ROOM [8].
Hình (A) là độ tƣơng quan giữa dự đoán của FBA, MOMA và ROOM với các dữ liệu thực nghiệm cho một dòng không nhân trong 3 điều kiện phát triển khác nhau. Hình (B,C) thể hiện so sánh MOMA và ROOM trong điều kiện glucose thấp. Các dòng đƣợc thể hiện bằng phần trăm glucose sử dụng.
Ngoài ra, với điều kiện glucose cao, ROOM tìm thấy một nghiệm khả thi mà chỉ các dòng trên đƣờng thay thế của các phản ứng bị bỏ là thay đổi đáng kể (đƣờng v16-v14v15 trong hình 4.11). Thật vậy, trong môi trƣờng glucose cao, dữ liệu thực nghiệm cho thấy hơn 3 dòng có chênh lệch lớn nhất giữa dạng hoang dã và dạng đột biến (Emmerling [17]). MOMA dự đoán thay đổi dòng nhỏ hơn trên đƣờng này, từ đó cho thấy phƣơng pháp cực tiểu hóa khoảng cách Euclid có thể không cho phép các thay đổi lớn.
Hình 4.10 Giản đồ miêu tả mạng trao đổi chất carbon trung tâm của E. coli [8].
Các dòng thực nghiệm gán nhãn từ v1–v24 và đƣợc đo theo hƣớng mũi tên. Chú ý rằng trong một số trƣờng hợp các dòng theo hƣớng ngƣợc lại đƣợc thể hiện bằng các giá trị âm. Mũi tên đậm thể hiện các đƣờng thay thế ngắn (v19–