4.2.1. Khái quát về xoá bỏ gen (Gene Knockouts hay Mutant)
Các hiệu ứng xảy ra khi một gen bị xoá bỏ là: Gen bị xoá -> Enzyme tƣơng ứng bị xoá -> Các phản ứng cần có enzyme xúc tác sẽ bị xoá -> Các cạnh tƣơng ứng trong mạng bị xoá -> Các dòng tƣơng ứng bị xoá (các vi tƣơng ứng bằng 0). Hình 4.3 cho ta thấy một ví dụ về việc gen bị xoá bỏ -> thay đổi mạng trao đổi chất.
Hình 4.3 Mô hình xoá bỏ gen [8].
4.2.2. Cực tiểu hoá điều chỉnh trao đổi chất (Minimization Of Metabolic Adjustment - MOMA) Adjustment - MOMA)
4.2.2.1.Giới thiệu phƣơng pháp MOMA
Những công trình nghiên cứu gần đây của Segre [4] và cộng sự đã giới thiệu ý tƣởng về phƣơng pháp điều chỉnh trao đổi tối thiểu (MOMA) cho một mạng trao đổi chất với gen bị xoá bỏ dựa trên giả thuyết rằng: khi không có quá trình tiến hoá và thích nghi lâu dài, một cơ thể đột biến có thể không phát triển tối ƣu, nhƣng có thể điều chỉnh các dòng phân phối càng gần với dạng tự nhiên
càng tốt. Nói cách khác phân phối dòng sau khi gen bị xoá bỏ tiến gần tới dạng tự nhiên theo khoảng cách Euclid. Hình 4.4 minh hoạ cho ý tƣởng này:
Hình 4.4 Nguyên lý tối ƣu của FBA và MOMA [4].
Một lƣợc đồ 2 chiều thể hiện không gian khả thi của dạng tự nhiên (ΦWT) và dạng đột biến dòng j (Φ j) đƣợc thể hiện bởi các đa giác màu xanh và vàng. Nghiệm của FBA là điểm tối đa hàm mục tiêu (đƣờng màu đỏ). Một dự đoán tối ƣu của FBA có thể dùng cho cả dạng tự nhiên (a) và dạng đột biến (b). Nghiệm đột biến của MOMA (c) tính bằng QP có thể xem nhƣ là phép chiếu vuông góc nghiệm FBA xuống không gian khả thi của dạng đột biến (Φ j). Nghiệm đột biến của FBA và MOMA nói chung là khác nhau.
Hình 4.5 Minh hoạ nghiệm của phƣơng pháp MOMA trên không gian nhiều chiều.
Nền tảng toán học cần thiết để đạt đƣợc mục tiêu là phép chiếu vuông góc nghiệm tự nhiên w xuống không gian khả thi Φm của dạng đột biến, biến đổi toán học đƣợc trình bày dƣới đây:
Giả sử:
w – vector giá trị dòng tối ƣu của dạng tự nhiên. v – vector giá trị dòng trong không gian đột biến.
Ta cần tìm v thoả mãn khoảng cách Euclidian giữa v và w là tối thiểu: Min f(v) = (v-w)T *( v-w)
<=> Min v2-2vw+w2
<=> Min v2-2vw vì w là hằng số <=> Min 0.5v 2- wv
<=> Min 0.5vT*I*v+L*v với I là ma trận dơn vị và L = -w,
Bài toán đƣợc biến đổi về dạng quy hoạch bậc hai, kết hợp với các ràng buộc nhƣ đã trinh bày chúng ta có công thức cho phƣơng pháp MOMA nhƣ sau:
0 0 : Subject to 2 1 : Minimize i high low T T v v v v v S v w v I v (4.3)
trong đó I là ma trận đơn vị, là chuyển vị của lời giải nguyên thuỷ tính đƣợc bằng FBA (hệ phƣơng trình 4.2) và “i” là chỉ số của gen bị loại bỏ. Các kết quả thực nghiệm đã chứng minh rằng với cơ thể đột biến thì MOMA cho kết quả dự đoán tốc độ phát triển của E. coli tốt hơn FBA.
Hình 4.6 Một minh hoạ cho các đƣờng phản ứng (pathway) của mạng carbon trung tâm của E. coli, màu sắc đƣợc sử dụng để phân biệt các pathway khác nhau [4].
Gen đột biến là tpiA, một trong 3 gen đƣợc dự đoán chính xác bởi MOMA (FBA không dự đoán đƣợc). Mỗi điểm là một giá trị dòng trong mạng đột biến tpiA, màu sắc khác nhau tƣơng ứng với các pathway khác nhau. Giá trị trên mỗi trục toạ độ tƣơng ứng với sự thay đổi của giá trị dự đoán khi đột biến bởi hai phƣơng pháp so với giá trị khi ở dạng tự nhiên. Chúng ta có thể thấy các điểm xanh lục tăng đáng kể với FBA trong khi không thay đổi với MOMA.
4.2.2.2.So sánh FBA và MOMA
Kết quả dự đoán phân phối dòng của MOMA và FBA của cùng một dạng đột biến cho thấy các kết quả nhƣ hình 4.8.
Hình 4.8 Kết quả dự đoán phân phối dòng của MOMA và FBA [4] .
Hình 4.8 cho thấy sự so sánh dự đoán đột biến gen pyk giữa FBA và MOMA. Các giá trị dòng thể hiện tỷ lệ phần trăm dòng glucose hấp thụ. A–C; D–F; G–I là kết quả với các điều kiện khác nhau. Với mỗi điều kiện, dự đoán
dạng tự nhiên của FBA (A, D, G) đƣợc so sánh với kết quả thực nghiệm tại đoạn JM101. Dự đoán dạng đột biến gen pyk của FBA (B, E, H) và MOMA (C, F, I) cũng đƣợc so sánh với thực nghiệm đột biến đoạn PB25. Màu sắc khác nhau tƣơng ứng với các pathways khác nhau
4.2.3. Cực tiểu hoá thay đổi điều hoà (Regulatory On/Off Minimization - ROOM) ROOM)
4.2.3.1.Giới thiệu về ROOM
Tối thiểu hoá thay đổi điều hoà (ROOM) là một mô hình dùng để dự đoán hành động của mạng trao đổi chất khi gen bị loại bỏ. Nó dựa vào việc tối thiểu hoá số lƣợng của các thay đổi dòng đáng kể so với dạng nguyên thuỷ. ROOM có cùng ý tƣởng nhƣ MOMA nhƣng sử dụng một độ đo khoảng cách khác so với MOMA dùng khoảng cách Euclid. Ngoài ra ROOM còn có khả năng xác định chính xác các đƣờng dẫn khác cho các phản ứng liên kết với các gen bị loại bỏ, điều này càng làm tăng tính tin cậy sinh học của ROOM. ROOM cũng tốt hơn MOMA trong việc dự đoán các dòng trong tế bào và khả năng sát thân của E. coli khi bị đột biến loại bỏ gen.
Một thách thức khác là việc dự đoán tính sát thân và kiểu hình của sinh vật sau khi xóa bỏ gen. Nhƣ đã trình bày trong nghiên cứu của Segre (2002) [4], giả thiết hành động tối ƣu của sinh vật bị xoá bỏ gen có thể không phản ánh chính xác các hành động trong thực tế. Thay vào đó, Segre gợi ý rằng các sinh vật đó điều chỉnh bằng cách tối thiểu hoá các thay đổi phân phối dòng của nó nhƣ cách tiếp cận của MOMA. Phƣơng pháp này cực tiểu theo tiêu chuẩn Euclid của sai khác dòng giữa các mạng trao đổi chất của sinh vật nguyên thuỷ và các dạng đột biến. MOMA đƣợc ghi nhận dự đoán thành công tính sát thân và giá trị dòng trao đổi chất của mạng đột biến của E. coli.
FBA giả thiết về tốc độ phát triển tối ƣu còn MOMA sử dụng độ đo Euclid nhƣng đều không phản ánh chính xác các điều chỉnh của mạng trao đổi chất sau đột biến. Nhƣợc điểm này là do độ đo Euclid có thể ngăn cản các thay đổi lớn của các dòng đơn. Các thay đổi lớn có thể cần để chuyển hƣớng dòng sang các đƣờng phản ứng khác và có thể thấy đƣợc trong thực nghiệm.
Chúng tôi đề nghị thay thế độ đo khoảng cách trong MOMA bằng cực tiểu hoá trạng thái lân cận. Phƣơng pháp mới của chúng tôi, ROOM đơn giản cực tiểu hoá số lƣợng các thay đổi dòng đáng kể. Đặc biệt, ROOM tìm kiếm phân phối dòng cho một giống đột biến mà thoả mãn các ràng buộc ma trận hệ số cân bằng, nhiệt động lực học và hiệu suất dòng, trong khi cực tiểu số lƣợng thay đổi dòng đáng kể so với dạng nguyên thuỷ. ROOM cải tiến dự đoán dòng trao đổi
chất tế bào của E. coli so với MOMA. ROOM cũng dự đoán tốt hơn MOMA về tính sát thân của men bia khi bị xoá bỏ gen ở mức độ lớn.
Kinh nghiệm tăng cƣờng của khoảng cách ROOM dựa trên ý tƣởng:
Các thay đổi điều hoà gen để thay đổi dòng sau khi gen bị xoá bỏ đƣợc cực tiểu hoá bởi tế bào khi cố gắng cực tiểu hoá chi phí thích nghi.
Những thay đổi điều hoà này có thể miêu tả bởi các giá trị on/off. ROOM hoàn toàn mô tả các thay đổi dòng bằng cách xác định các thay đổi dòng đáng kể.
4.2.3.2.Phƣơng pháp ROOM
ROOM tìm kiếm một phân phối dòng thoả mãn cùng ràng buộc nhƣ FBA trong khi cực tiểu hoá số lƣợng thay đổi dòng đáng kể. Chúng ta chỉ tính các thay đổi dòng đáng kể vì luôn tồn tại các nhiễu cố hữu trong các hệ thống sinh học và cũng là để giảm thời gian xử lý. Chúng ta dùng MILP nhƣ sau:
Minimize yi i1 m subject to Sv = 0 vmin v vmax vj 0,j A vi yi(vmax,iwiu)wiu (*) vi yi(vmin,i wil) wil (**) yi {0,1} (***) wiu wiwi wil wiwi
với mỗi dòng i, 1<= i <= m, yi = 1 nếu vi có thay đổi dòng đáng kể và yi = 0 trong trƣờng hợp còn lại, wu
and wl là các ngƣỡng để xác định thay đổi dòng, với
δ, ε là các khoảng dung sai tƣơng đối và tuyệt đối tƣơng ứng với w và A trong MOMA.
Thật vậy, với yi = 1, bất đẳng thức (*) và (**) không tạo ra ràng buộc mới
với vi, trong khi nếu yi = 0 thì đó là các ràng buộc mới. Kích thƣớc của δ, ε ảnh hƣởng đến thời gian chạy của thuật toán MILP; chúng tôi chọn các giá trị nhỏ nhất mà vẫn có kết quả trong thời gian có thể chấp nhận. (Đặc biệt, chúng tôi
chọn δ = 0.03, ε =0.001 để dự đoán dòng và δ = 0.1, ε =0.01 để dự đoán tính sát thân). Sự lựa chọn các tham số ảnh hƣởng đến kết quả phân phối dòng của giải thuật bởi nó cho phép cộng (δ) và nhân (ε) một lƣợng nhỏ dòng để điều chỉnh các đƣờng thay thế mà không mất chi phí. Thời gian chạy với bài toán MILP chỉ là vài giây.
Khi bỏ qua các ràng buộc số nguyên trong (***) thành 0<=yi <=1 thì bài toán trở thành biến thể của quy hoạch tuyến tính. Với biến thể này, các tham số δ, ε đƣợc cho bằng 0. Dự đoán dựa trên biến thể LP của ROOM cũng khá chính xác dù kém hơn so với ROOM ban đầu. Công thức MILP dùng để dự đoán dòng của E. coli và dự đoán tính sát thân của men, trong khi LP dùng để dự đoán tính sát thân và tốc độ phát triển của E. coli. Điều thú vị là công thức LP của ROOM đôi khi tƣơng tự với một biến thể của MOMA.
4.2.3.3.So sánh MOMA và ROOM
Dự đoán dòng
Các số liệu dòng trao đổi chất của E. coli bị xoá gen có trong báo cáo của Emmerling [17]. Bộ sƣu tập 17 dòng nội bào trong mạng trao đổi chất carbon trung tâm của E. coli đƣợc xác định theo kinh nghiệm bằng cách kết hợp quang phổ NMR trong các thí nghiệm đánh dấu bằng 13C (đồng vị carbon) và các số liệu sinh lý học (xem thêm ở tài liệu tham khảo). Các dòng của cả dạng nguyên thuỷ (JM101) và dạng đột biến pyk (PB25) đều đƣợc đo với 3 điều kiện phát
triển khác nhau để cho ra sáu tập kết quả. Hai điều kiện hạn chế glucose đƣợc dùng (nồng độ thấp / cao) và một điều kiện hạn chế nitrogen (nitơ).
Để mô hình hoá dạng đột biến pyk (PB25, pykA::kan pykF::cat), hai phản ứng từ Phosphoenolpyruvate (PEP) tới Pyruvate (PYR) đƣợc đặt bằng không.
Trong báo cáo của Segre (2002) [4] đã so sánh dự đoán của FBA và MOMA với tập hợp các dòng thực nghiệm này. Với dạng hoang dã FBA dự đoán tốt trong cả 3 trƣờng hợp, trong khi với dạng đột biến pyk kết quả dự đoán tồi cho cả 2 trƣờng hợp môi trƣờng glucose thấp và nitrogen thấp. MOMA dự đoán cho dạng đột biến tốt hơn nhiều so với FBA.
Dự đoán của ROOM cho dạng đột biến pyk chính xác hơn đáng kể so với FBA và MOMA. Với cả 2 thí nghiệm glucose thấp và nitrogen hạn chế, độ tƣơng quan của ROOM với dữ liệu dòng thực nghiệm cao hơn 12% so với MOMA (Hình 4.10A). Hình 4.10 B,C so sánh độ chính xác dự đoán của MOMA và ROOM.
Hình 4.9 So sánh FBA, MOMA và ROOM [8].
Hình (A) là độ tƣơng quan giữa dự đoán của FBA, MOMA và ROOM với các dữ liệu thực nghiệm cho một dòng không nhân trong 3 điều kiện phát triển khác nhau. Hình (B,C) thể hiện so sánh MOMA và ROOM trong điều kiện glucose thấp. Các dòng đƣợc thể hiện bằng phần trăm glucose sử dụng.
Ngoài ra, với điều kiện glucose cao, ROOM tìm thấy một nghiệm khả thi mà chỉ các dòng trên đƣờng thay thế của các phản ứng bị bỏ là thay đổi đáng kể (đƣờng v16-v14v15 trong hình 4.11). Thật vậy, trong môi trƣờng glucose cao, dữ liệu thực nghiệm cho thấy hơn 3 dòng có chênh lệch lớn nhất giữa dạng hoang dã và dạng đột biến (Emmerling [17]). MOMA dự đoán thay đổi dòng nhỏ hơn trên đƣờng này, từ đó cho thấy phƣơng pháp cực tiểu hóa khoảng cách Euclid có thể không cho phép các thay đổi lớn.
Hình 4.10 Giản đồ miêu tả mạng trao đổi chất carbon trung tâm của E. coli [8].
Các dòng thực nghiệm gán nhãn từ v1–v24 và đƣợc đo theo hƣớng mũi tên. Chú ý rằng trong một số trƣờng hợp các dòng theo hƣớng ngƣợc lại đƣợc thể hiện bằng các giá trị âm. Mũi tên đậm thể hiện các đƣờng thay thế ngắn (v19– v18–v21) đƣợc dự đoán bởi ROOM với gen pyk bị loại bỏ (đánh dấu X) trong
điều kiện glucose trung bình. Các thay đổi lớn của flux trên đƣờng này đƣợc xác định qua thực nghiệm.
Một đánh giá rộng bằng mô phỏng việc xoá bỏ gen của Saccharomyces cerevisiae đã đƣợc trình bày bởi Forster et al. (2003). FBA đƣợc dùng để tính tốc độ phát triển tối đa cho 555 gen xoá bỏ. Một gen đƣợc cho là sát thân nếu tốc độ phát triển tối đa của dạng đột biến tƣơng ứng nhỏ hơn 5% dạng hoang dã. FBA dự đoán chính xác tính sát thân của 89.6% số gen. Chúng tôi kiểm tra cả MOMA và ROOM trên mô hình này để nghiên cứu một tập hợp các gen có liên quan với nhau.
Các gen đƣợc dự đoán là sát thân bởi FBA cũng đƣợc dự đoán bởi MOMA và ROOM vì tốc độ phát triển tối đa tính đƣợc bởi FBA chỉ có thể giảm với MOMA và ROOM. Cùng chạy MOMA với các gen có thể dự đoán bởi FBA cho kết quả tồi hơn đáng kể hơn FBA. Đặc biệt, ngoài các gen đó thì MOMA dự đoán nhầm 50 gen là sát thân (hình 4.12). Ngƣợc lại, kết quả của ROOM trên các gen đó tƣơng đƣơng hoàn toàn với FBA.
Hình 4.11 Danh sách 50 gen MOMA dự đoán nhầm.
Chúng tôi chuyển sang kiểm tra 50 gen mà ROOM và FBA đều dự đoán đúng còn MOMA dự đoán sai. Nhƣ thực nghiệm E.coli trong môi trƣờng
glucose cao, ROOM tìm ra một đƣờng thay thế ngắn nhất cho các phản ứng bị loại bỏ. Dự đoán sai của MOMA khiến nó đƣa ra một lời giải sai.
4.2.3.4.Mở rộng của ROOM
Như đã trình bày ở trên, các con đường khác đôi được sử dụng bởi các giống đột biến để chuyển hướng dòng. Do đó các mô hình dựa trên ràng buộc cần phải chứa cả các đường thay thế hay các đặc tính cấu trúc mạng như là khoảng cách từ phản ứng bị xoá bỏ. Để làm điều này, một biến thể của ROOM có thể gắn các giá trị chi phí khác nhau cho các thay đổi dòng đáng kể
của các phản ứng khác nhau. Đặc biệt, hàm mục tiêu có thể được thay đổi để
cực tiểu
m i ciyi
1 , với ci là chi phí để thay đổi dòng i. Ví dụ, để tính cho các đường thay thế, mỗi phản ứng trên một đường thay thế được gán một chi phí tỷ lệ với độ dài đường. Các phản ứng còn lại sẽ được gán chi phí cao hơn.
Thực tế, chúng tôi thấy rằng khi gắn các chi phí lớn hơn cho các thay đổi dòng đáng kể không sử dụng biến thể của ROOM, các kết quả dự đoán có tốt hơn một chút. Dự đoán này cho thấy để điều hoà một gen không phải nguyên thuỷ
CHƢƠNG 5 - BÀI TOÁN CỤ THỂ VÀ PHƢƠNG PHÁP TIẾP CẬN
5.1. Phát biểu bài toán
Bài toán cần tìm các cặp chuỗi gen có tính không giao hoán thể hiện khi thứ tự đột biến gen là AB thì sinh vật vẫn tồn tại và thứ tự đột biến gen là BA dẫn đến sinh vật bị tiêu diệt hay ngƣợc lại. Các khả năng có thể xảy ra với hai gen đột biến A, B là:
1. Đột biến gen A: sinh vật vẫn tồn tại