Dự đoán sự choán chỗ và các trạng thái thay đổi của histone

Một phần của tài liệu Dự đoán và phân tích các trạng thái của Histone trong chuỗi DNA bằng phương pháp conditional random fields (Trang 68 - 69)

Kết quả dựđoán đối với 14 tập dữ liệu liệt kê trong Bảng 7 và Bảng 8 là đồng nhất với các nghiên cứu trước đó. Khi so sánh với kết quả dự đoán trong [34] thì thấy kết quả này cao hơn, điều này được giải thích như sau: Trong [34], chúng tôi coi mỗi chuỗi quan sát chỉ có duy nhất 1 phần tử nên trong mô hình không tận dụng sức mạnh của cấu trúc đồ thị CRFs và không có được các feature thể hiện mối quan hệ giữa các phần tử trong cùng một chuỗi quan sát. Khi so sánh với phương pháp sử dụng SVM trong [26] thì thấy kết quả này cao hơn không đáng kể vì bản thân CRFs không tích hợp được thông tin quan trọng là tần suất xuất hiện của các feature trong vector biểu diễn đoạn DNA, chẳng hạn trong cùng 1 đoạn DNA thì feature xuất hiện nhiều hơn sẽ có tầm quan trọng hơn so với feature xuất hiện ít. Trong khi đó SVM thì thực hiện vịệc này một cách dễ dàng [26]. Tuy nhiên, lợi thế của mô hình CRFs là dễ dàng tích hợp được nhiều loại thông tin khác nhau để mô tả mối quan hệ giữa các phần tử trong cùng một chuỗi quan sát. Điều này rất có ích đối với dữ liệu sinh học, vì bản thân các phần tử trong cơ thể sống không tồn tại riêng lẻ mà luôn

chịu sự tác động của rất nhiều yếu tố khác nhau. Mặc dù tỉ lệ lỗi trong các nghiên cứu thực nghiệm tương đối cao (khoảng 25%) [27]. Nhưng cũng không thểđưa ra một so sánh định lượng giữa độ chính xác của phương pháp tính toán và phương pháp thực nghiệm, vì bản thân phương pháp tính toán đã dựa trên dữ liệu thực nghiệm. Tuy nhiên, kết quả dự đoán của phương pháp thực nghiệm có thể dùng để kiểm tra mức độ hợp lý của các nghiên cứu thực nghiệm và hỗ trợ người làm thực nghiệm trong việc lựa chọn các tham số phù hợp.

Một phần của tài liệu Dự đoán và phân tích các trạng thái của Histone trong chuỗi DNA bằng phương pháp conditional random fields (Trang 68 - 69)