THỰC HIỆN VÀ THỬ NGHIỆM BÀI TOÁN

Một phần của tài liệu ÁP DỤNG THUẬT TOÁN ILA ĐỂ RÚT RA TẬP LUẬT BỆNH SỎI THẬN (Trang 27)

C: Tiểu nhiều lần.

THỰC HIỆN VÀ THỬ NGHIỆM BÀI TOÁN

Kiểm thử bằng chương trình

Hình : 12 tập dữ liệu của bệnh sỏi thận

Hình : Tập dữ liệu khi loại bỏ lần 1 trong bảng con thứ 1

Hình : Tập dữ liệu khi loại bỏ lần 3 trong bảng con thứ 1

Hình : Tập dữ liệu khi loại bỏ lần 1 trong bảng con thứ 2

Hình : Tập dữ liệu đã xét xong trong bảng con thứ 2

KẾT LUẬN

Từ những bảng khảo sát tưởng như rất bình thường nhưng lại chứa đựng trong đó rất nhiều thông tin hữu ích nếu như chúng ta biết cách khai thác để rút ra tập luật một cách hiệu quả mà điển hình là bài toán rút ra tập luật bệnh sỏi thận thông qua giải thuật ILA.

Giải thuật ILA là một giải thuật đệ quy dễ thực hiện, đơn giản và mạnh mẽ trong việc phân lớp dữ liệu. Các kết quả đánh giá cho đến thời điểm hiện tại cho thấy giải thuật ILA hoàn toàn có thể cạnh tranh với các giải thuật nổi tiếng khác. Trong tài liệu này, giải thuật ILA đã được áp dụng để phát sinh các luật dẫn dạng IF-THEN từ tập dữ liệu mẫu thử đầu vào. Các kết quả đạt được đã đem so sánh với kết quả của giải thuật nổi tiếng khác là ID3 trên cùng tập mẫu thử. Kết quả trên tất cả các phép kiểm tra cho thấy rằng giải thuật ILA đã tạo ra được các luật dẫn có tính tổng quát cao. Điều này đạt được là nhờ ILA đã loại bỏ được vấn đề dư thừa các điều kiện (tức các thuộc tính) không cần thiết. Độ chính xác của các luật dẫn từ giải thuật ILA cao hơn độ chính xác của các luật dẫn từ giải thuật dùng cây quyết định ID3.

Kết quả thử nghiệm cũng đưa ra được tập luật chẩn đoán bệnh sỏi thận, tuy nhiên tập mẫu còn ít dữ liệu. Để có thể áp dụng chính xác việc chẩn đoán cần có thêm nhiều tập mẫu hơn nữa nhằm đánh giá đúng bản chất tập luật của căn bệnh này.

Hướng tiếp theo cần nghiên cứu tìm cách thực hiện 2 sự cải tiến trên giải thuật ILA. Thứ nhất là cải tiến khả năng xử lý của giải thuật trên các mẫu thử có dữ liệu bị nhiễu hay chưa có đầy đủ dữ liệu, đó là trường hợp dữ liệu trên các thuộc tính có thể bị sai hay chưa có dữ liệu. Thứ hai là cố gắng chuyển giải thuật ILA thành giải thuật có thể xử lý trên các vùng có dữ liệu liên tục mà cụ thể là chuyển thuật toán ILA sang thuật toán ILA2.

Về cơ bản khóa luận đã thực hiện được mục tiêu đề ra. Tuy nhiên, phần mềm vẫn còn nhiều thiếu sót và hạn chế. Rất mong nhận được sự góp ý của quý Thầy Cô để báo cáo được hoàn thiện hơn.

Một phần của tài liệu ÁP DỤNG THUẬT TOÁN ILA ĐỂ RÚT RA TẬP LUẬT BỆNH SỎI THẬN (Trang 27)