Xõy dựng chƣơng trỡnh

Một phần của tài liệu Khai phá dữ liệu sử dụng luật kết hợp (Trang 91)

Thuật toỏn chớnh của chƣơng trỡnh đƣợc tham khảo và chƣơng trỡnh đƣợc xõy

Mụ tả cấu trỳc và cỏc lớp dữ liệu nhƣ sau:

 Lớp CItems: mụ tả dữ liệu và cỏc phộp toỏn cho tập cỏc mục (tập cỏc

mụn học-đặc điểm cỏc loại nấm) bao gồm số phần tử, độ hỗ trợ của tập mục.

 Lớp CSetOfItems: lớp dựng để lƣu trữ danh sỏch tập cỏc mục phổ biến (một mảng cỏc CItems), bao gồm số cỏc tập mục, một danh sỏch liờn kết chỉ đến cỏc tập mục.

 struct t_Nodes: là cấu trỳc dữ liệu mụ tả cõy FP-Tree, mụ tả đƣờng đi bao gồm cỏc mục phổ biến đó đƣợc sắp thứ tự trong tất cả cỏc lần mua bỏo của khỏch hàng.

Cỏc hàm chớnh của chƣơng trỡnh:

Sumsupports()I: thực hiện việc đọc dữ liệu từ cơ sở dữ liệu

CSDL.txt, tỡm những tập mục phổ biến, xõy dựng tệp tree_data.txt chỉ lƣu những tập mục phổ biến đó đƣợc sắp của mỗi tỏc vụ.

Buildtree(): Đọc dữ liệu từ tệp tree_data.txt vừa xõy dựng để xõy dựng cõy FP-Tree (Cõy FP-Tree chỉ bao gồm cỏc mục phổ biến).

FindpopularItems(): từ cõy FP-Tree tỡm cỏc tập mục phổ biến, lần lƣợt tỡm cỏc tập mục phổ biến cú chứa mục cú độ hỗ trợ cực tiểu đến cỏc mục cú độ hỗ trợ lớn nhất trong số cỏc tập mục phổ biến đó tỡm đƣợc.

BuildAllRule(): thực hiện việc tỡm tất cả cỏc luật từ tập mục phổ biến thỏa món độ tin cậy cực tiểu.

Giao diện của chƣơng trỡnh:

Thứ tự thực hiện thao tỏc chƣơng trỡnh nhƣ sau:

: Thao tỏc khởi tạo File CSDL. Ta sẽ xem xột tới việc đỏnh giỏ 46 sinh viờn theo kết quả điều tra nhƣ sau:

Thực hiện bấm nỳt và chọn cỏc File dữ liệu đầu vào (Cỏc File kết quả đỏnh giỏ từ sinh viờn đó đƣợc quột vào mỏy tớnh )

Thực hiện thao tỏc sau khi cỏc File dữ liệu đó đƣợc chọn

xong.

Tiến hành kiểm tra và xem xột với danh sỏch sinh viờn mà chƣơng trỡnh đó xử lý. Tƣơng ứng với từng sinh viờn là cỏc lựa chọn của họ cho cỏc mụn học yờu thớch

Bƣớc cuối cựng là việc thực hiện . Chọn tờn File dữ liệu kết xuất và đƣờng dẫn phự hợp.

Thực hiện việc chọn File dữ liệu vửa mới kết xuất

Nhập vào thụng tin về độ hỗ trợ cực tiểu, độ tin cậy cực tiểu và chọn tệp cơ

sở dữ liệu. Sau đú nhấn nỳt

Chƣơng trỡnh sẽ hiển thị lờn thụng tin về số lƣợng cỏc mục, số lƣợng cỏc tỏc vụ, số lƣợng mục phổ biến.

Hỡnh 4.7 Màn hỡnh chọn File kết xuất

Bƣớc tiếp theo là nhấn vào nỳt tất cả cỏc tập mục phổ biến thỏa món độ tin cậy cực tiểu đó nhập vào sẽ hiện lờn trờn grid Tập cỏc mục phổ biến nhƣ hỡnh 4.2 sau. Một cột của grid ghi tờn cỏc tập mục phổ biến, một cột ghi thụng tin độ hỗ trợ của mục đú, cỏc tập mục phổ biến sẽ đƣợc sắp giảm dần về số lƣợng cỏc mục. Kết quả nhƣ sau:

Hỡnh 4.9 Màn hỡnh kết quả sau khi đọc dữ liệu vào

Bƣớc cuối cựng là kớch vào nỳt để sinh ra cỏc luật thỏa món độ tin cậy cực tiểu từ tập mục phổ biến đó tỡm ở trờn. Grid Tập cỏc luật sinh ra sẽ hiện lờn cỏc luật nhƣ hỡnh 4.2 sau:

Số lƣợng tập mục phổ biến và số cỏc luật sinh ra sẽ hiện trờn hai ụ textbox nhƣ hỡnh 4.2 trờn. Mỗi luật bao gồm phần tiền đề, phần kết luận, hai cột cuối ghi thụng tin về độ hỗ trợ và độ tin cậy của luật.

Thớ dụ luật: CN17  CN19, CN08, CN11 và cú độ hỗ trợ là 0.238095 và độ

tin cậy là 0.833333

Trong thớ dụ trờn với độ hỗ trợ cực tiểu 0.15 và độ tin cậy cực tiểu 0.6 tiến hành khai phỏ trờn tệp CSC.txt kết quả tỡm đƣợc 118 tập mục phổ biến và 233 luật.

Nỳt lệnh cho phộp thực hiện ứng dụng với cỏc phiếu điều tra mụn học khỏc. Khi nhấn vào nỳt này chƣơng trỡnh trở về trạng thỏi ban đầu nhƣ hỡnh 4.1

Nỳt lệnh dựng để hiển thị một cỏch chớnh xỏc và đầy đủ

hơn về kết quả theo yờu cầu của ngƣời sử dụng. Chẳng hạn xem một mụn cụ thể cú thứ tự đƣợc chọn ở vị trớ nào, cỏc nhúm mụn học nào đƣợc chọn cựng nhau nhiều nhất v.v.

Nỳt lệnh để đúng chƣơng trỡnh.

Một phần của tài liệu Khai phá dữ liệu sử dụng luật kết hợp (Trang 91)

Tải bản đầy đủ (PDF)

(107 trang)