Chương 1 BÀI TOÁN ƯỚC LƯỢNG SỰ BIẾN ĐỔI CỦA AXÍT AMIN
1.6. Các phương pháp so sánh hai mô hình
1.6.1. So sánh bằng việc xây dựng cây ML
Phương pháp so sánh hai mô hình dựa trên các cây phân loài xây dựng bằng phương pháp ML là cách so sánh phổ biến nhất. Cả hai mô hình cùng được sử dụng để xây dựng cây phân loài bằng phương pháp ML với cùng một tập các sắp hàng đa chuỗi.
Gọi M1, M2 là hai mô hình cần so sánh. Với mỗi sắp hàng Da, cây phân loài tương ứng với M1 là Ta1, với M2 là Ta2. Giá trị likelihood của hai cây tương ứng là
L(Ta1) và L(Ta2). Nếu L(Ta1) > L(Ta2) thể hiện M1 tốt hơn M2. Ngược lại, nếu L(Ta1) <
L(Ta2) thể hiện M2 tốt hơn M1. Trong thực tế, để việc tính toán dễ dàng hơn người ta thường so sánh giá trị log(likelihood) với log là hàm lôgarít tự nhiên.
1.6.2. So sánh cấu trúc cây
Phương pháp so sánh cấu trúc cây không dùng để đánh giá mô hình nào tốt hơn mà được dùng để chỉ ra sự khác biệt giữa hai mô hình khi sử dụng để xây dựng cây phân loài. Chúng ta so sánh cấu trúc hai cây xây dựng từ cùng một sắp hàng với hai mô hình khác nhau. Hai cây có cấu trúc càng giống nhau thể hiện hai mô hình càng giống nhau.
Để đo sự khác biệt giữa cấu trúc của hai cây, chúng tôi sử dụng khoảng cách Robinson-Fould (RF) [51]. Khoảng cách RF giữa cấu trúc của hai cây là tỷ lệ giữa số phân vùng chỉ có ở một trong hai cây trên tổng số phân vùng của cả hai cây. Khoảng cách RF có khoảng giá trị từ 0,0 đến 1,0. Giá trị RF giữa hai cây càng nhỏ thì cấu trúc của hai cây càng giống nhau.
1.6.3. So sánh độ tương quan Pearson
Độ tương quan Pearson giữa hai ma trận hệ số hoán đổi R1 của mô hình M1, R2
của mô hình M2 sẽ giúp đánh giá mối quan hệ tuyến tính giữa các hệ số tương ứng của hai ma trận. Độ tương quan Pearson có khoảng giá trị từ -1,0 đến 1,0. Độ tương quan bằng -1,0 thể hiện hai ma trận có tương quan cùng giảm, ngược lại nếu độ tương quan bằng 1,0 thể hiện hai ma trận có tương quan cùng tăng. Độ tương quan bằng 0 thể hiện hai ma trận không có tương quan với nhau. Chúng ta cũng có so sánh tương tự với véc tơ tần số xuất hiện các axít amin của hai mô hình.