Sử dụng thuật toán CCC-Biclustering.

Một phần của tài liệu Nghiên cứu các thuật toán biclustering cho trường hợp dữ liệu biểu hiện gien theo chuỗi thời gian (Trang 59 - 62)

- Output: l(k) (2 k≤ m) các chuỗi con và độ dài của nó.

4.2.1.Sử dụng thuật toán CCC-Biclustering.

KẾT QUẢ THỰC NGHIỆM

4.2.1.Sử dụng thuật toán CCC-Biclustering.

Dưới đây là tham số cụ thể của thuật toán đối với ma trận dữ liệu, bằng phần mềm BigGesTS [2]. Ở đây chúng tôi không đưa ra được cụ thể và toàn bộ các bicluster (vì lý do độ dài dữ liệu) mà chỉ đưa ra cụ thể kích thước của 10 bicluster dưới bảng sau.

Tên

Bicluster Yeaststress Bicluster CellCycle Gien

Kích thướ

c

Số thời

điểm thời gianKhoảng Gien thướcKích Số thờiđiểm thời gianKhoảng

Bicluster1 631 1262 2 60-80 739 1478 2 16-17 Bicluster2 1509 3018 2 40-60 645 1290 2 15-16 Bicluster3 245 735 3 40-80 61 183 3 15-17 Bicluster4 1126 3378 3 40-80 313 939 3 15-17 Bicluster5 138 414 3 40-80 271 813 3 15-17 Bicluster6 1292 2584 2 30-40 649 1298 2 14-15 Bicluster7 405 1215 3 30-60 59 177 3 14-16 Bicluster8 14 56 4 30-80 2 8 4 14-17 Bicluster9 377 1508 4 30-80 37 148 4 14-17 Bicluster1 0 14 56 4 30-80 20 80 4 14-17

Bảng 2. Kết quả của thuật toán CCC-Biclustering với hai tập dữ liệu

Biểu diễn Bicluster

1. Với bảng dữ liệu của loài Yeast, tham số detal =0.01, chúng ta thấy trong 10 bicluster trên tổng số 1993 bicluster của tập dữ liệu Yeaststress. Bicluster1 là bicluster xấu nhất và bicluster9 là bicluster tốt nhất. Dựa vào danh sách bicluster, chúng tôi chọn bicluster 8 để làm ví dụ mô tả chi tiết về

Nhóm gien: {PHO3, YCR016w, PMP1, SWM1, CCA1, TAF6, MNT2, RPL26b, CBP1, BIR1, YNL089c, WTM2, YOR283w, FHL1}

Nhóm thời điểm: {30, 40, 60, 80}

Hình 4.3. Hình ảnh dữ liệu biểu hiện các gien của Bicluster 8

Hình 4.4. Đồ thị thể hiện dữ liệu biểu hiện các gien của Bicluster 8

2. Với tập dữ liệu CellCycle. Ở đây chúng tôi cũng không đưa ra cụ thể và toàn bộ các bicluster mà chỉ đưa ra cụ thể kích thước của 10 bicluster trên

tổng số 16186 bicluster. Được thực hiện trên ma trận đã chuẩn hóa với tập ký tự trong bảng chữ cái ∑. Nhìn chung các Bicluster có thể hiện biến thiên tương đối tập trung trong nhóm gien, một số bicluster chỉ thể hiện trên một số lượng ít gien như Bicluster 8, số lượng gien giữa các Bicluster có chênh lệch lớn. Bicluster 1 là bicluster xấu nhất và bicluster 5 là bicluster tốt nhất. Dựa vào danh sách bicluster, chúng tôi chọn bicluster 10 để làm ví dụ mô tả chi tiết về hình ảnh sự biến thiên về giá trị các thành phần của chúng:

Hình 4.5. Đồ thị biểu hiện gien của 10 Bicluster trong tập dữ liệu CellCycle

Dưới đây chúng tôi chọn bicluster10 để làm ví dụ mô tả chi tiết về hình ảnh sự biến thiên về giá trị các thành phần của chúng:

Hình 4.7. Đồ thị thể hiện dữ liệu biểu hiện các gien của Bicluster 10

Một phần của tài liệu Nghiên cứu các thuật toán biclustering cho trường hợp dữ liệu biểu hiện gien theo chuỗi thời gian (Trang 59 - 62)