Phân tích và đánh giá mô hình

Một phần của tài liệu Phát triển mô hình thay thế axit amin cho dữ liệu hệ gen (Trang 72 - 77)

Chương 2: Mô hình thay thế axit amin FLAVI cho Flavivirus

2.4.2 Phân tích và đánh giá mô hình

Bảng 2. 2 tổng hợp hệ số tương quan của các cặp mô hình, nửa trên của bảng thể hiện

hệ số tương quan của các cặp ma trận hệ số hoán đổi trong khi nửa dưới thể hiện hệ

số tương quan của các vectơ tần số axit amin. Hệ số tương quan Pearson thấp giữa các cặp mô hình thể hiện sự khác nhau đáng kể giữa các mô hình.

Hệ số tương quan của ma trận hệ số hoán đổi của FLAVI với các mô hình còn lại có giá trị dao động từ 0.67 (tương quan với rtREV) tới 0.92 (tương quan với FLU); trong khi hệ số tương quan của vectơ tần số thay đổi từ 0.59 (HIVw) tới 0.90 (JTT). Các giá trị này chứng tỏ FLAVI có nhiều điểm khác so với các mô hình đã có. Khi quan

71

Bảng 2. 2. Hệ số tương quan Pearson giữa FLAVI và các mô hình khác. Giá trị ở nửa trên là hệ số tương quan của ma trận hệ số hóa đổi, nửa dưới là tương quan của các vectơ tần số

FLAVI JTT LG HIVw HIVb FLU rtREV

FLAVI - 0.88 0.77 0.89 0.91 0.92 0.67

JTT 0.90 - 0.91 0.80 0.90 0.87 0.83

LG 0.85 0.96 - 0.65 0.80 0.81 0.95

HIVw 0.59 0.58 0.55 - 0.85 0.84 0.54

HIVb 0.86 0.88 0.89 0.66 - 0.86 0.71

FLU 0.73 0.80 0.72 0.84 0.72 - 0.75

rtREV 0.80 0.86 0.87 0.59 0.90 0.67 -

sát tương quan của ma trận hệ số hoán đổi trong mô hình FLAVI với hai mô hình chung (JTT và LG) ta thấy các giá trị này thấp hơn so với các mô hình thay thế axit amin của vi rút trừ mô hình rtREV. Xu hướng này là hợp lý vì những mô hình này được đề xuất để biểu diễn quá trình tiến hóa của các loài nói chung nên khó có thể biểu diễn tốt quá trình biến đổi diễn ra trên vi rút. Riêng mô hình rtREV được ước lượng cho retrovirus từ bộ dữ liệu khá nhỏ - chỉ có 33 trình tự, do vậy có thể có nhiều điểm khác các mô hình vi rút còn lại.

Khi so sánh từng tham số trên ba mô hình LG, HIVb và FLAVI, bên cạnh các đặc điểm tương đồng có nhiều điểm khác biệt về giá trị thành phần trên mỗi mô hình - xem Hình 2. 2, Hình 2. 3. Hình 2. 2 biểu diễn tần số của mỗi axit amin trong ba vectơ tần số của ba mô hình, trong đó một số axit amin có tần số gần bằng nhau như I (Isoleucine), L (Leucine) hay K (Lysine) trong khi một số axit amin có tần số khác nhau đáng kể như tần suất của M (Methionine) trong FLAVI là 4% xấp xỉ gấp đôi trong hai mô hình còn lại; tần suất của W (Tryptophan) trong FLAVI gấp khoảng ba

72

lần giá trị tương ứng của LG. Hình 2. 3 mô tả hệ số hoán đổi của ba ma trận tương ứng trong các mô hình FLAVI, HIVb, và LG. Về cơ bản, sự hoán đổi xảy ra trên cả

ba mô hình phù hợp một cách tương đối, tuân theo quy luật tiến hóa chung thể hiện

ở các cụm vòng tròn thường có kích thước tương đồng về mức độ lớn/nhỏ. Tuy nhiên

có một số khác biệt dễ thấy giữa các mô hình, ví dụ như các mẫu thay thế trên hàng

T (Threonine), cột C (Systeine), Q (Glutamine) điển hình là tỉ lệ thay thế giữa T và I của FLAVI lớn gấp nhiều lần của LG, hay tỉ lệ của thay thế giữa T và K, N (Asparagine) của HIVb lớn hơn nhiều FLAVI.

Khi phân tích sự khác biệt giữa từng cặp hệ số hoán đổi, ta thấy có sự khác biệt lớn thể hiện qua số lượng vòng tròn lớn chiếm đa số trên Hình 2. 4. Cụ thể, có 89 trong

số 189 cặp hệ số của ma trận hoán đổi trong mô hình FLAVI và HIVb sai khác nhau trên 5 lần, con số này là 99 đối với mô hình LG (Bảng 2. 3). Kết quả cho thấy mô hình FLAVI khác biệt với các mô hình hiện có, đặc biệt là khác các mô hình chung,

do vậy sử dụng mô hình chung để phân tích dữ liệu Flavivirus là không phù hợp. Hình 2. 2. Tần số của 20 axit amin trong ba mô hình FLAVI, LG và HIVb.

73

Hình 2. 3. Ma trận hệ số hoán đổi của ba mô hình FLAVI, HIVb và LG. Vòng tròn màu đen, xám và trắng tại hàng X, cột Y thể hiện hệ số hoán đổi giữa axit amin X và Y của mô hình FLAVI, LG và HIVb

74

Hình 2. 4. So sánh tương quan các hệ số hoán đổi giữa FLAVI với HIVb (Hình a) và LG (Hình b). Các hình tròn hiển thị sự khác biệt tương đối giữa hệ số hoán đổi trong FLAVI với X (HIVb hoặc LG) giá trị được tính bằng (FLAVI_XY – HIVb_XY)/(FLAVI_XY + HIVb_XY) . Các hình tròn màu đen thể hiện hệ số của FLAVI lớn hơn X, màu trắng thể hiện hệ

số của X lớn hơn FLAVI. Giá trị 1/3 hoặc 2/3 có nghĩa hệ số của FLAVI lớn hơn X 2 hoặc 5 lần. Giá trị -1/3 hoặc -2/3 có nghĩa hệ số của X lớn hơn FLAVI 2 hoặc 5 lần.

a. So sánh hệ số hoán đổi trên hai mô hình FLAVI và HIVb b. So sánh hệ số hoán đổi trên hai mô hình FLAVI và LG

75

Bảng 2. 3. Sự khác nhau trên từng phần tử trong ma trận hoán đổi. Giá trị ở hàng

“gấp đôi”, cột “FLAVI>HIVb” là số hệ số trong ma trận FLAVI lớn hơn hoặc bằng hai lần hệ số ở vị trí tương ứng trong ma trận HIVb. Các giá trị khác trong bảng có

ý nghĩa tương tự.

FLAVI > HIVb HIVb > FLAVI FLAVI > LG LG > FLAVI

Gấp đôi 31 96 24 120

Gấp năm 18 71 7 92

Một phần của tài liệu Phát triển mô hình thay thế axit amin cho dữ liệu hệ gen (Trang 72 - 77)

Tải bản đầy đủ (PDF)

(137 trang)