Tính đúng đắn và độ phức tạp

Một phần của tài liệu Ứng dụng cây quyết định mờ trong khai phá dữ liệu (Trang 37)

Dễ nhận ra tính đúng của giải thuật AS vì trong thực hiện của giải thuật AS, mỗi bít dữ liệu lỗi (thuộc bộ xử lý bất kỳ) có duy nhất một tiến trình ở chế độ mở quét nó. Nhƣ vậy, nếu giải thiết việc thực hiện giải thuật trên mỗi bộ xử lý đơn lẻ là đúng đắn thì mỗi bít lỗi sẽ đƣợc sửa (đảo) đúng một lần và trở thành bít đúng. Ngoài ra, giải thuật cũng sẽ dừng khi các tiến trình gặp đƣợc các mốc tƣơng ứng.

Độ phức tạp thời gian và thông báo đƣợc các tác giả phát biểu và chứng minh trong các định lý nhƣ sau.

Định lý 3.1. [3]. Theo mô hình từ, giải thuật AS có độ phức tạp truyền thông là O(n + ∆) và độ phức tạp thời gian là O((n + min {m, ∆}) log2

m).

Chứng minh [3]. Trong thực hiện của giải thuật AS, mỗi bít lỗi cần một thông báo sửa lỗi nên có tổng ∆ thông báo sửa lỗi. Tiến trình chính di chuyển hết chuỗi nên có n

thông báo chuyển tiến trình chính. Mỗi tiến trình khác, có chiều cao m’ < m, sử dụng nhiều nhất m’ thông báo chuyển tiến trình, và đƣợc tạo ra nhƣ một tiến trình con trên hoặc con dƣới của một tiến trình (giả sử Q) có chiều cao 2m’, sau khi Q đã gặp 2m’ bít lỗi. Do vậy số thông báo chuyển tiến trình khác tiến trình chính nhiều nhất bằng số bít lỗi. Nhƣ vậy, tổng số thông báo nhiều nhất là n + 2∆.

Biểu diễn các thông báo và quan hệ thứ tự giữa các thông báo bằng một đồ thị phụ thuộc (dependency graph), trong đó mỗi thông báo là một nút, mỗi liên kết chỉ ra thông báo ở đầu liên kết phải “xảy ra trƣớc” thông báo ở cuối liên kết, các tác giả đã chứng minh độ phức tạp thời gian của giải thuật là O((n + min {m, ∆}) log2

m).

Xem chi tiết chứng minh độ phức tạp thời gian trong [3]. Kết quả này trực tiếp dẫn đến định lý sau.

Định lý 3.2. [3]. Theo mô hình bít, giải thuật AS có độ phức tạp truyền thông là O((n + ∆) log m) và độ phức tạp thời gian là O((n + min {m, ∆}) log3

m).

Một phần của tài liệu Ứng dụng cây quyết định mờ trong khai phá dữ liệu (Trang 37)