1 Nguyễn Lan Anh Nữ 5 TN x 2 Lê Nhật Minh Nam 35 TN x x x x
3.3 Kết quả thực nghiệm
Thực hiện khai phá trên cơ sở dữ liệu bệnh hen suyễn của Bệnh viện C – Thái Nguyên với minsup = 0.6 và minconf = 0.3 cho kết quả:
- Danh sách tập mục thường xuyên đĩng:
{BHS2,Test1}, {S1,TN1,Test1}, {KT1, BMbbh1, Test1}, {T2, TN1, Test1}, {H1, TN1, Test1}, {H1, Test1},…
- Danh sách luật kết hợp:
TN1, Test1 S1 Test1 S1, TN1
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ BMbbh1, Test1 KT1
Test1 KT1, BMbbh1 TN1, Test1 T2 …
Giải thích kết quả khai phá:
Để hiểu được ý nghĩa của các tập mục thường xuyên và các luật kết hợp tìm được, ta cần tra mã thuộc tính quay lại tên thuộc tính, ý nghĩa các thuộc tính đĩ.
Ví dụ:
- Tập mục thường xuyên đĩng: {S1,TN1,Test1} với minsup = 0.6 cĩ nghĩa
là: 3 triệu chứng bệnh là Sốt, Tức ngực và Test da dương tính cùng xuất hiện trong 60% các trường hợp bệnh.
- Luật kết hợp: TN1, Test1 S1 với minsup = 0.6 và minconf = 0.3 cĩ
nghĩa là: 3 triệu chứng bệnh là Sốt, Tức ngực, Test da dương tính cùng xuất hiện trong 60% các trường hợp bệnh, 30% bệnh nhân cĩ triệu chứng Tức ngực và Test da dương tính sẽ cĩ triệu chứng Sốt.
Các kết quả khai phá này rất hữu ích cho các nhà quản lý và các bác sĩ tham khảo trong quá trình chẩn đốn và điều trị bệnh.
3.4 Nhận xét
Qua kết quả thực nghiệm thuật tốn cho thấy: Khi khai phá trên tệp dữ liệu với ngưỡng độ hỗ trợ và ngưỡng độ tin cậy xác định thì số lượng tập mục thường xuyên đĩng nhỏ hơn nhiều so với số tập mục thường xuyên, từ đĩ dẫn đến luật kết hợp sinh ra ít dư thừa hơn. Khi thay đổi ngưỡng độ hỗ trợ, ngưỡng độ tin cậy thì số lượng tập mục thường xuyên đĩng và các luật cũng thay đổi (tỉ lệ nghịch). Khai phá trên tập dữ liệu càng lớn hoặc với ngưỡng độ hỗ trợ càng nhỏ thì thuật tốn CHARM càng thể hiện rõ tính hiệu quả.
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/