Phức tạp thuật toán

Một phần của tài liệu Nghiên cứu các thuật toán biclustering cho trường hợp dữ liệu biểu hiện gien theo chuỗi thời gian (Trang 38 - 39)

- Output: l(k) (2 k≤ m) các chuỗi con và độ dài của nó.

3.1.3.3.phức tạp thuật toán

13. Đưa ra CCC-Bicluster tương ứng với nút v.

3.1.3.3.phức tạp thuật toán

Với cấu trúc dữ liệu phù hợp và sử dụng thuật toán Ukkonen[6], thời gian xây dựng cây hậu tố là tuyến tính trên kích thước của ma trận đầu vào được tính là O(|R||C|). Các bước còn lại của thuật toán CCC-Biclustering cũng là tuyến tính, các vòng lặp được thực hiện bằng cách tìm kiếm theo sâu (dfs) trên cây hậu tố. Kể cả khi cây có nút trong ít hơn nút lá, độ phức tạp với thời gian tuyến tính của thuật toán CCC-Biclustering là một kết quả khả thi.

Trên thực tế độ phức tạp của việc dựng cây hậu tố phụ thuộc vào kích thước bảng chữ cái vì vậy mà nó trở nên quan trọng khi bảng chữ cái đủ lớn [5]. Do đó, người ta phải đảm bảo sự gia tăng kích thước bảng chữ cái từ |∑| đến |C||∑| là rất lớn, việc chuyển đổi bảng chữ cái được mô tả trong phần trên, không ảnh hưởng đến độ phúc tạp của thuật toán. Tuy nhiên, chỉ có một nút trong, đó là nút gốc (root), có số lượng nút con phụ thuộc vào số lượng cột. Như có thể quan sát thấy cây hậu tố trong ví dụ ở hình 3.4 tất cả các nút trong khác nút gốc có số lượng nút con cũng không ảnh hưởng bởi số lượng các cột. Bởi vì, sau khi việc chuyển đổi bảng chữ cái, các chuỗi nhãn của một nút trong tương ứng với một mẫu biểu hiện chung cho tập các gien giữa tập các thời điểm liên tục, luôn bắt đầu tại một thời điểm cụ thể. Điều này dẫn đến một lượng lớn nút con là O(|∑|) mà không phải O(|C||∑|).

Các nút trong chỉ có lá với nhãn cạnh là ký tự kết thúc, có thể có một số nút con sẽ phát triển với số lượng hàng trong ma trận, nhưng số lượng này không phụ thuộc vào số lượng cột. Việc phân nhánh ở gốc được thực hiện trong thời gian là hằng số. Như vậy theo các nhận xét trên thì tổng độ phức tạp của thuật toán CCC-Biclustering là O(|R||C|).

Một phần của tài liệu Nghiên cứu các thuật toán biclustering cho trường hợp dữ liệu biểu hiện gien theo chuỗi thời gian (Trang 38 - 39)