Bảng các tập TMTX tương ứng với các ngưỡng

Một phần của tài liệu (Luận văn Đại học Thương mại) NGHIÊN CỨU ỨNG DỤNG MỘT SỐ THUẬT TOÁN KHAI PHÁ DỮ LIỆU HỖ TRỢ PHÂN TÍCH CƠ SỞ DỮ LIỆU BÁN HÀNG SIÊU THỊ (Trang 36 - 40)

Ngưỡng 0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85

Tập

TMTX FI

36 Các tập mục phổ biến và độ hỗ trợ a:0.8 c:0.8 d:0.8 e:0.9 ac:0.6 ad:0.7 ae:0.8 cd:0.6 ce:0.7 de:0.8 acd:0.5 ace:0.6 ade:0.7 cde:0.6 a:0.8 c:0.8 d:0.8 e:0.9 ac:0.6 ad:0.7 ae:0.8 cd:0.6 ce:0.7 de:0.8 ace:0.6 ade:0.7 cde:0.6 a:0.8 c:0.8 d:0.8 e:0.9 ac:0.6 ad:0.7 ae:0.8 cd:0.6 ce:0.7 de:0.8 ace:0.6 ade:0.7 cde:0.6 a:0.8 c:0.8 d:0.8 e:0.9 ad:0.7 ae:0.8 ce:0.7 de:0.8 ade:0.7 a:0.8 c:0.8 d:0.8 e:0.9 ad:0.7 ae:0.8 ce:0.7 de:0.8 ade:0.7 a:0.8 c:0.8 d:0.8 e:0.9 ae:0.8 de:0.8 a:0.8 c:0.8 d:0.8 e:0.9 ae:0.8 de:0.8 e:0.9

Sau khi tiến hành mã hóa lại các mặt hàng từ bảng 5 ta thu được các bảng mặt hàng/nhóm hàng thường xuyên xuất hiện và xuất hiện cùng nhau tương ứng với các ngưỡng (từ bảng 6 đến bảng 10).

Bảng 6. Bảng mặt hàng/nhóm hàng thường xuyên xuất hiện và xuất hiện cùng

nhau với ngưỡng 𝛆𝐭𝟏 = 𝟎. 𝟓

Mặt hàng/nhóm hàng thường xuyên xuất hiện

Các nhóm mặt hàng thường xuyên xuất hiện cùng nhau Bàn chải:0.8

Bột giặt:0.8 Dầu gội:0.8 Sữa tắm:0.9

Bàn chải, Bột giặt:0.6 Bàn chải, Dầu gội:0.7 Bàn chải, Sữa tắm:0.8 Bột giặt, Dầu gội:0.6 Bột giặt, Sữa tắm:0.7 Dầu gội, Sữa tắm:0.8 Bàn chải, Bột giặt, Dầu gội:0.5

Bàn chải, Bột giặt, Sữa tắm:0.6

Bàn chải, Dầu gội, Sữa tắm:0.7

Bột giặt, Dầu gội Sữa tắm:0.6

Bàn chải, Bột giặt:0.6 Bàn chải, Dầu gội:0.7 Bàn chải, Sữa tắm:0.8 Bột giặt, Dầu gội:0.6 Bột giặt, Sữa tắm:0.7 Dầu gội, Sữa tắm:0.8 Bàn chải, Bột giặt, Dầu gội:0.5

Bàn chải, Bột giặt, Sữa tắm:0.6

Bàn chải, Dầu gội, Sữa tắm:0.7

Bột giặt, Dầu gội Sữa tắm:0.6

Bảng 7. Bảng mặt hàng/nhóm hàng thường xuyên xuất hiện và xuất hiện cùng

nhau với ngưỡng 𝛆𝐭𝟐 = 𝟎. 𝟓𝟓 𝐯à 𝛆𝐭𝟑 = 𝟎. 𝟔

Mặt hàng/nhóm hàng thường xuyên xuất hiện

Các nhóm mặt hàng thường xuyên xuất hiện cùng nhau Bàn chải:0.8

Bột giặt:0.8 Dầu gội:0.8

Bàn chải, Bột giặt:0.6 Bàn chải, Dầu gội:0.7 Bàn chải, Sữa tắm:0.8

37 Sữa tắm:0.9

Bàn chải, Bột giặt:0.6 Bàn chải, Dầu gội:0.7 Bàn chải, Sữa tắm:0.8 Bột giặt, Dầu gội:0.6 Bột giặt, Sữa tắm:0.7 Dầu gội, Sữa tắm:0.8

Bàn chải, Bột giặt, Sữa tắm:0.6 Bàn chải, Dầu gội, Sữa tắm:0.7 Bột giặt, Dầu gội Sữa tắm:0.6

Bột giặt, Dầu gội:0.6 Bột giặt, Sữa tắm:0.7 Dầu gội, Sữa tắm:0.8

Bàn chải, Bột giặt, Sữa tắm:0.6 Bàn chải, Dầu gội, Sữa tắm:0.7 Bột giặt, Dầu gội Sữa tắm:0.6

Bảng 8. Bảng mặt hàng/nhóm hàng thường xuyên xuất hiện và xuất hiện cùng

nhau với ngưỡng 𝛆𝐭𝟒 = 𝟎. 𝟔𝟓 𝐯à 𝛆𝐭𝟓 = 𝟎. 𝟕

Mặt hàng/nhóm hàng thường xuyên xuất hiện

Các nhóm mặt hàng thường xuyên xuất hiện cùng nhau

Bàn chải:0.8 Bột giặt:0.8 Dầu gội:0.8 Sữa tắm:0.9

Bàn chải, Dầu gội:0.7 Bàn chải, Sữa tắm:0.8 Bột giặt, Sữa tắm:0.7 Dầu gội, Sữa tắm:0.8

Bàn chải, Dầu gội, Sữa tắm:0.7

Bàn chải, Dầu gội:0.7 Bàn chải, Sữa tắm:0.8 Bột giặt, Sữa tắm:0.7 Dầu gội, Sữa tắm:0.8

Bàn chải, Dầu gội, Sữa tắm:0.7

Bảng 9. Bảng mặt hàng/nhóm hàng thường xuyên xuất hiện và xuất hiện cùng

nhau với ngưỡng 𝛆𝐭𝟔 = 𝟎. 𝟕𝟓 𝐯à 𝛆𝐭𝟕 = 𝟎. 𝟖

Mặt hàng/nhóm hàng thường xuyên xuất hiện

Các nhóm mặt hàng thường xuyên xuất hiện cùng nhau

Bàn chải:0.8 Bột giặt:0.8 Dầu gội:0.8 Sữa tắm:0.9

Bàn chải, Sữa tắm:0.8 Dầu gội, Sữa tắm:0.8

Bàn chải, Sữa tắm:0.8 Dầu gội, Sữa tắm:0.8

Bảng 10. Bảng mặt hàng/nhóm hàng thường xuyên xuất hiện và xuất hiện cùng

nhau với ngưỡng 𝛆𝐭𝟖 = 𝟎. 𝟖𝟓

Mặt hàng/nhóm hàng thường xuyên xuất hiện

Các nhóm mặt hàng thường xuyên

xuất hiện cùng nhau

Sữa tắm:0.9 

Phân tích, đánh giá kết quả khai phá

Qua quá trình khai phá dữ liệu ta thu được các bảng mặt hàng/nhóm hàng thường xuyên xuất hiện và xuất hiện cùng nhau với ngưỡng độ hỗ trợ tối thiểu tương ứng (từ bảng 6 đến bảng 10) và có các phân tích, đánh giá như sau:

38 - Với các ngưỡng độ hỗ trợ tối thiểu tăng dần thì số các mặt hàng/nhóm hàng xuất hiện thường xuyên là giảm dần.

- Với ngưỡng độ hỗ trợ tối thiểu nhỏ nhất (εt1=0.5) và kết quả trong bảng 4 nhận

thấy:

+ Thu được tập 14 mặt hàng/nhóm hàng thường xuyên (cột 1 trong bảng 6)

+ Mức độ quan trọng lần lượt từ lớn nhất đến nhỏ nhất của 14 mặt hàng/nhóm hàng là: “Sữa tắm:0.9” (mức độ quan trọng nhất), tiếp đến là “Bàn chải:0.8”, “Bột giặt:0.8”, “Dầu gội:0.8”, …, “Bột giặt, Dầu gội, Sữa tắm:0.6” có mức độ quan trọng nhỏ nhất (cột 2 trong bảng 6).

+ Có 10 giỏ hàng thường xuyên có các mặt hàng xuất hiện cùng nhau là: “Bàn chải, Bột giặt”; “Bàn chải, Bột giặt, Dầu gội”; “Bàn chải, Bột giặt, Sữa tắm”; “Bột giặt, Dầu Gội, Sữa tắm”.

+ Mức độ quan trọng từ lớn nhất đến nhỏ nhất của nhóm các mặt hàng thường xuyên xuất hiện cùng nhau theo trình tự là: “Bàn chải, Sữa tắm:0.8”, “Dầu gội, Sữa tắm:0.8”, …, “Bột giặt, Dầu gội Sữa tắm:0.6”.

+ Mức độ quan trọng nhỏ nhất của nhóm các mặt hàng xuất hiện cùng nhau là “Bàn chải, Bột giặt, Dầu gội:0.5”

- Với hai ngưỡng độ hỗ trợ tối thiểu εt2 = 0.55 và εt3 = 0.6 và kết quả trong

bảng 7 nhận thấy:

+ Số các mặt hàng/nhóm hàng xuất hiện thường xuyên đều bằng nhau (là 13), số các mặt hàng/nhóm hàng xuất hiện cùng nhau thường xuyên đều bằng nhau (là 9)

+ Thu được tập 13 mặt hàng/nhóm hàng thường xuyên (cột 1 trong bảng 7)

+ Mức độ quan trọng lần lượt từ lớn nhất đến nhỏ nhất của của 13 mặt hàng/nhóm hàng là: “Sữa tắm:0.9”, “Bàn chải:0.8”, “Bột giặt:0.8”, “Dầu gội:0.8”, …, “Bột giặt, Dầu gội, Sữa tắm:0.6” (cột 2 trong bảng 9).

+ Có 9 giỏ hàng thường xuyên có các mặt hàng xuất hiện cùng nhau là: “Bàn chải, Bột giặt”; “Bàn chải, Bột giặt, Dầu gội”; “Bàn chải, Bột giặt, Sữa tắm”; “Bột giặt, Dầu Gội, Sữa tắm”.

+ Mức độ quan trọng lớn nhất của nhóm các mặt hàng thường xuyên xuất hiện cùng nhau là “Bàn chải, Sữa tắm:0.8” và mức độ quan trọng nhỏ nhất của nhóm các mặt hàng thường xuyên xuất hiện cùng nhau là “Bột giặt, Dầu gội Sữa tắm:0.6”.

- Với hai ngưỡng ngưỡng độ hỗ trợ tối thiểu εt4, εt5, εt6 và εt7 được phân tích,

đánh giá tương tự như trên.

- Với ngưỡng độ hỗ trợ tối thiểu εt8 = 0.85 và kết quả trong bảng 10 cho thấy:

+ Chỉ có một mặt hàng xuất hiện thường xuyên cùng độ hỗ trợ là “Sữa tắm:0.9”. + Khơng có nhóm các mặt hàng xuất hiện cùng nhaụ

- Nếu ngưỡng độ hỗ trợ càng nhỏ thì mặt hàng/nhóm các mặt hàng phổ biến xuất hiện càng xuất hiện nhiều, ngược lại thì mặt hàng/nhóm các mặt hàng phổ biến xuất hiện ít đị

39

3.1.2. Ứng dụng thuật toán BMB khai phá TMTX

Dưới đây trình ví dụ ứng dụng của thuật tốn BMB khai phá TMTX trong phân tích CSDL bán hàng siêu thị.

Đặt bài toán

Giả sử siêu thị bán các mặt hàng bao gồm: Bàn chải (a), Dầu gội (b), Kem đánh răng (c), Dầu xả vải (d), Bột giặt (e), Xà phòng (f), Bàn cạo râu (g), Băng dính (h). Trong kì kinh doanh, siêu thị bán được 10 giỏ hàng, dữ liệu của các giỏ hàng bán được cho trong bảng 11 dưới đâỵ

Bảng 11. Dữ liệu khác về các giỏ hàng bán ra của siêu thị (sau mã hóa tên hàng)

Yêu cầu: Với ngưỡng độ hỗ trợ tối thiểu minsup=4.

- Mặt hàng/nhóm các mặt hàng nào thường xuyên xuất hiện cùng nhau trong các giỏ hàng?

- Mức độ quan trọng của mặt hàng/nhóm mặt hàng thường xuyên xuất hiện như thế nàỏ

Ứng dụng thuật toán BMB và thuật toán FP-Growth khai phá TMTX trong CSDL giao tác

Để tiến hành thực nghiệm thuật toán BMB với trường hợp nghiên cứu đặt ra ở trên, quá trình khai phá các TMTX trong CSDL bán hàng siêu thị là như sau:

Pha 1. Chuyển CSDL giao tác TDB về ma trận nhị phân A có dạng như trong

bảng 10.

Một phần của tài liệu (Luận văn Đại học Thương mại) NGHIÊN CỨU ỨNG DỤNG MỘT SỐ THUẬT TOÁN KHAI PHÁ DỮ LIỆU HỖ TRỢ PHÂN TÍCH CƠ SỞ DỮ LIỆU BÁN HÀNG SIÊU THỊ (Trang 36 - 40)

Tải bản đầy đủ (PDF)

(96 trang)