- Tao_cay: Duyệt cơ sở dữ liệu và gọi Create_FPTree để tạo cỏc cõy con phụ thuộc
3. Cỏc module của chƣơng trỡnh:
Với mục đớch xõy dựng ứng dụng khai phỏ dữ liệu phục vụ cụng tỏc nghiờn cứu và cụng tỏc nghiệp vụ của ngành Cụng an, bƣớc đầu ta xõy dựng một chƣơng trỡnh ứng dụng khai phỏ dữ liệu tai nạn theo cỏc chuyờn đề nờu trờn. Với mỗi chuyờn đề, chẳng hạn nhƣ chuyờn đề khai phỏ dữ liệu theo lỗi với thƣơng tật thỡ cỏc bƣớc thực hiện khai phỏ sẽ đƣợc thực hiện tuần tự nhƣ sau:
Đầu tiờn ta đăng nhập vào hệ thống, giả thiết là việc đăng nhập thành cụng:
Để cú thể khai phỏ dữ liệu theo lỗi của ngƣời điều khiển phƣơng tiện với thƣơng tật, trƣớc hết ta sử dụng bảng dữ liệu gốc là nguoi_dkpt, dm_loi_dieu_khien, dm_thuong_tat để biến cỏc dữ liệu thuộc tớnh nhận giỏ trị trong khoảng thành giỏ trị nhị phõn. Việc này đƣợc thực hiện thụng qua chức năng
Dữ liệu - > Theo lỗi với thƣơng tật
Ở đõy chƣơng trỡnh cho phộp ngƣời sử dụng cú quyền tựy chọn một hay nhiều lỗi cũng nhƣ một hay nhiều tỡnh trạng thƣơng tật. Để bao quỏt hết cỏc trƣờng hợp ở đõy ta chọn tất cỏc cỏc loại lỗi và tất cả cỏc tỡnh trạng thƣơng tật. Sau khi chọn xong ta sẽ tạo ra một bảng, gọi là Chuyende1 với số cột đỳng bằng số mục lỗi trong danh mục lỗi cộng với số mục thƣơng tật trong danh mục thƣơng tật. Với quy ƣớc rằng tất cả cỏc cột cú tiếp đầu ngữ là L + giỏ trị mó ( nhƣ L01) là cột này sinh ra ra từ bảng lỗi gắn với lỗi cú mó là 01 và tƣơng tự với bảng thƣơng tật.
Sau khi tạo xong bảng, ta duyệt cơ sở dữ liệu gốc là bảng nguoi_dkpt. Với mỗi lần duyệt ta kiểm tra 02 trƣờng là lỗi và thƣơng tật. Giả sử rằng mó lỗi là 02 và mó tỡnh trạng thƣơng tật là 04 khi đú hai trƣờng L02 và T04 cú giỏ trị là 1 cũn cỏc trƣờng khỏc cú giỏ trị NULL. Nhƣ vậy bảng chuyende1 sẽ gồm số bản ghi bằng số bản ghi trong bảng dữ liệu gốc nguoi_dkpt và mỗi bản ghi chỉ cú 02 trƣờng cú dữ liệu
Sau khi tạo xong bảng và chốn đủ dữ liệu ta chuyển sang chức năng khai phỏ dữ liệu: Khai phỏ dữ liệu-> Theo lỗi với thƣơng tật
Đầu tiờn ta kớch nỳt thực hiện để xõy dựng mảng chứa cỏc mục thỏa món minsupp. Giỏ trị minsupp này là tựy chọn tựy theo ngƣời dựng. Với minsupp là 5% khi đú kớch nỳt thực hiện ta thu đƣợc danh sỏch cỏc mục thỏa món minsupp, phớa dƣới là giải thớch ý nghĩa cỏc mục
Ở đõy ta cú thể hiểu là T01 nghĩa là ngƣời điều khiển phƣơng tiện gõy tai nạn bị chết, L01 nghĩa là ngƣời điều khiển mắc lỗi chạy quỏ tốc độ quy định.
Chọn minsupp =2%, kớch hoạt nỳt thực hiện và nỳt tạo cõy FP-Tree ta sẽ thu đƣợc kết quả nhƣ sau:
Ở đõy vỡ cõy đƣợc thể hiện là một mảng cỏc nỳt nờn nú đƣợc thể hiện nhƣ màn hỡnh phớa bờn phải. Ta cú thể đọc cõy này nhƣ sau
- Cõy này gốc cú ID là 0, nhón “”
- Những nỳt cú ParentID=0 sẽ là con của gốc này: vớ dụ T17,T01,T07 .... - Nỳt T17 cú nỳt cha là gốc và cú nỳt con là L01, L04, ... và số đếm là 1115 Nhƣ thế ta cú thể vẽ cỏc nhỏnh nhƣ sau: {}->T17->L01; {}->T17->L04
Tƣơng tự khi đọc cỏc nhỏnh khỏc. Tiếp đến, trờn cơ sở cõy FP-Tree này ta sẽ kớnh nỳt tập mục phổ biến để sinh ra cỏc tập mục phổ biến
Nhỡn trờn hỡnh vẽ trờn, bỏ qua cỏc tập một mục phổ biến ta thấy rằng với độ hỗ trợ là 2% ta thu đƣợc 06 tập mục phổ biến trong quỏ trỡnh khai phỏ dữ liệu là
- T17L02, độ hỗ trợ 67/2301 - T17L13, độ hỗ trợ 70/2301 - T17L11, độ hỗ trợ 51/2301 - T17L03, độ hỗ trợ 84/2301 - L04T07, độ hỗ trợ 54/2301 - L04T16, độ hỗ trợ 46/2301
Trờn cơ sở cỏc tập mục phổ biến núi trờn ta cú thể sinh ra cỏc luật khi kớch họat vào nỳt Sinh luật, khi đú ta thu đƣợc cỏc luật với độ hỗ trợ và độ tin cậy nhƣ dƣới đõy
Cuối cựng ta thu đƣợc cỏc luật cựng với độ hỗ trợ và độ tin cậy cho nhƣ dƣới bảng sau:
Số thứ tự Luật Độ hỗ trợ Độ tin cậy
L1). T17->L02 2,90% 6% L2). L02->T17 2,90% 77% L3). T17->L13 3,04% 6,28% L4). L13->T17 3,04% 56,91% L5). T17->L11 2,22% 4,57% L6). L11->T17 2,22% 38,35% L7). T17->L03 3,65% 7,53% L8). L03->T17 3,65% 52,5% L9). L04->T07 2,35% 15,47% L10). T07->L04 2,35% 23,68% L11). L04->T16 2,00% 13,18% L12). T16->L04 2,00% 16,67%
Với ý nghĩa cỏc mục nhƣ sau: - T17: Khụng cú thƣơng tật - T16: Cỏc thƣơng tật khỏc - T07: Bị thƣơng nhẹ - L13: Cỏc lỗi khỏc - L11: Khụng chỳ ý quan sỏt - L04: Đi khụng đỳng phần đƣờng quy định - L03: Vƣợt khụng đỳng quy định
- L02: Khụng giảm tốc độ trong cỏc trƣờng hợp quy định
Ta cú thể kết luận rằng:
- Ngƣời điều khiển phƣơng tiện mắc lỗi đi khụng đỳng phần đƣờng quy định thỡ bị thƣơng nhẹ với độ hỗ trợ 2,35 % và độ tin cậy là 15,47%
- Ngƣời điều khiển phƣơng tiện mắc lỗi vƣợt khụng đỳng quy định nhƣng khụng bị thƣơng với độ hỗ trợ 3,65 % và độ tin cậy là 52,5%