5. Bố cục của luận văn
3.2.3. Xây dựng mô hình KPDL và kết quả đạt được
Bộ công cụ Data Mining Structures của BI cho phép người dùng chọn các thuật toán có sẵn để tạo mô hình KPDL, ở đây chọn thuật toán Decision Trees và thiết lập các tham số cho mô hình như Hình 3.3.
Hình 3.3. Thiết lập tham số mô hình DT
- Minimum_Support = 3: Số lượng tối thiểu để tạo nút lá là 3 trường hợp.
- Score_Method = 1: Sử dụng phương pháp Entropy để tính toán điểm phân chia
- Split_Method= 2: Tạo ra cây có nhiều sự chia tách với nhiều nút nhánh Còn các tham số khác thì sử dụng các giá trị mặc định. Sau khi sử dụng thuật toán DT với các tham số như Hình 3.3, kết quả mô hình như Hình 3.4.
Từ mô hình cây quyết định chẩn đoán bệnh RLTC giải thích một số luật được sinh ra từ cây quyết định dùng để chẩn đoán như sau:
Luật 1. f3buonchan = '5-7ngay' and f16yeucs = '1-2ngay' and f11ngukyg
= '5-7ngay' and B_Mdanhnhau = '>4Lan_Thang' and Bitreuchoc = 'ThuongXuyen' Then Ketqua = Yes
Luật 2. f3buonchan = '5-7ngay' and f16yeucs = '3-4ngay' and
B_Mdanhnhau = '<1Lan_Thang' Then Ketqua = No
Luật 3. f3buonchan = '3-4ngay' and f16yeucs = '1-2ngay' and f11ngukyg = '<1ngay' and f20klamviec = '3-4ngay' and Gtinh = 'Nu' and Apluchtap = 'ApLucNhieu' Then Ketqua = Yes
Luật 4. f3buonchan = '3-4ngay' and f16yeucs = '<1ngay' and
f13nchuyenit = '5-7ngay' and Gvtrungphat = 'HiemKhi' and Gvnatno = 'ThinhThoang' Then Ketqua=Yes
Luật 5. f3buonchan = '3-4ngay' and f16yeucs = '1-2ngay' and f11ngukyg = '<1ngay' and f20klamviec = '3-4ngay' and Gtinh = 'Nu' and Apluchtap = 'ApLucVua' Then Ketqua=No
Luật 6. f3buonchan = '3-4ngay' and f16yeucs = '1-2ngay' and f11ngukyg = '<1ngay' and f20klamviec = '<1ngay' Then Ketqua=No
Luật 7. f3buonchan = '1-2ngay' and f16yeucs = '3-4ngay' and
Gvtrungphat = 'ThuongXuyen' and f20klamviec = '1-2ngay' Then
Ketqua=No
Luật 8. f3buonchan='1-2ngay' and f16yeucs = '1-2ngay' and
Gvtrungphat = 'ChuaBaoGio' and B_Mcainhau = '>4Lan_Thang' Then
Ketqua = No
Luật 9. f3buonchan = '3-4ngay' and f16yeucs = '1-2ngay' and f11ngukyg = '<1ngay' and f20klamviec = '3-4ngay' and Gtinh = 'Nu' and Apluchtap = 'ApLucVua' Then Ketqua = No
Ngoài ra, BI cũng hỗ trợ đưa ra câu lệnh truy vấn ứng với trường hợp này: SELECT [Tree].[Ketqua], t.[ID], Predict([Tree].[Ketqua]), PredictProbability([Tree].[Ketqua]) From [Tree] PREDICTION JOIN OPENQUERY([RLTC-26-4chuan3], 'SELECT [ID],[gtinh],[tuoi],[B_Mcainhau],[B_Mdanhnhau], [KQHT],
[apluchtap],[gvnatno],[gvtrungphat], [bitreuchoc], [bidanhdap], [f1khochiu], [f2khongmuonan], [f17khoc], [f5taptrungchuy],
[f6suysup],[f7metmoi],[f9cdthatbai],[f10sohai],
[f11ngukyg],[f12vuive], [f13nchuyenit], [f14codon], [f16yeucs],[f3buonchan],[f8hyvong],[f20klamviec],[Ketqua]
FROM
[dbo].[dudoan] ') AS t
ON
[Tree].[Gtinh] = t.[gtinh] AND [Tree].[Tuoi] = t.[tuoi] AND
[Tree].[B Mcainhau] = t.[B_Mcainhau] AND [Tree].[B Mdanhnhau] = t.[B_Mdanhnhau] AND [Tree].[KQHT] = t.[KQHT] AND
[Tree].[Apluchtap] = t.[apluchtap] AND [Tree].[Gvnatno] = t.[gvnatno] AND
[Tree].[Gvtrungphat] = t.[gvtrungphat] AND [Tree].[Bitreuchoc] = t.[bitreuchoc] AND [Tree].[Bidanhdap] = t.[bidanhdap] AND [Tree].[f1khochiu] = t.[f1khochiu] AND
[Tree].[f2khongmuonan] = t.[f2khongmuonan] AND [Tree].[f17khoc] = t.[f17khoc] AND
[Tree].[f5taptrungchuy] = t.[f5taptrungchuy] AND [Tree].[f6suysup] = t.[f6suysup] AND
[Tree].[f7metmoi] = t.[f7metmoi] AND [Tree].[f9cdthatbai] = t.[f9cdthatbai] AND [Tree].[f10sohai] = t.[f10sohai] AND [Tree].[f11ngukyg] = t.[f11ngukyg] AND [Tree].[f12vuive] = t.[f12vuive] AND
[Tree].[f13nchuyenit] = t.[f13nchuyenit] AND [Tree].[f14codon] = t.[f14codon] AND
[Tree].[f16yeucs] = t.[f16yeucs] AND [Tree].[f3buonchan] = t.[f3buonchan] AND [Tree].[f8hyvong] = t.[f8hyvong] AND [Tree].[f20klamviec] = t.[f20klamviec] AND [Tree].[Ketqua] = t.[Ketqua]