Màn hình tìm luật kết hợp

Màn hình này có chức năng tìm ra các luật kết hợp từ cơ sở dữ liệu khi nhập độ phổ biến tối thiểu và độ tin cậy tối thiểu.

Trang 32

KẾT LUẬN

Khai phá dữ liệu là một trong những kỹ thuật quan trọng. Sự bùng nổ thơng tin, dữ liệu tồn cầu, trên mọi mặt của đời sống xã hội cùng với sự phát triển và ứng dụng ngày càng rộng rãi của công nghệ thông tin trong mọi lĩnh vực đã dẫn đến nhu cầu xử lý những khối dữ liệu khổng lồ để kết xuất ra những thông tin, tri thức hữu ích cho người sử dụng một cách tự động, nhanh chóng và trở thành nhân tố quan trọng hàng đầu cho mọi thành công của các cơ quan, tổ chức và cá nhân trên thế giới.

Khai phá dữ liệu đang được áp dụng một cách rộng rãi trong nhiều lĩnh vực kinh doanh và đời sống khác nhau. Rất nhiều tổ chức và công ty lớn trên thế giới đã áp dụng kỹ thuật khai phá dữ liệu vào các hoạt động sản xuất kinh doanh của mình và thu được những lợi ích to lớn.

Một trong những phương pháp quan trọng và cơ bản nhất của kỹ thuật khai phá dữ liệu mà đề tài tìm hiểu là khai phá luật kết hợp. Mục tiêu của phương pháp này là phát hiện và đưa ra các mối liên hệ giữa các giá trị dữ liệu trong cơ sở dữ liệu.

Do thời gian nghiên cứu đề tài còn hạn chế nhưng đã tổng kết được các kiến thức cơ bản nhất của phương pháp khai phá luật kết hợp. Đồng thời cũng đã cài đặt chương trình nhằm thực nghiệm khai phá luật kết hợp cho một cơ sở dữ liệu thực tế. Dựa vào các luật được tìm ra khi nhập độ phổ biến tối thiểu và độ tin cậy tối thiểu, các thông tin rút ra từ các luật này được sử dụng để hỗ trợ cho các nhà quản lý đề ra những cải tiến cho chương trình đào tạo.

Điểm hạn chế của đề tài là nguồn dữ liệu dùng để khai phá chưa nhiều, điều này dẫn đến việc tìm ra các luật chưa có độ phổ biến và độ tin cậy cao. Tuy nhiên, trong quá trình thực hiện đề tài, tác giả đã xây dựng được một chương trình phần mềm dùng để tìm ra mối quan hệ giữa các học phần của sinh viên đạt kết quả không tốt.

Trang 33

Hướng phát triển tiếp theo, sẽ nghiên cứu cài đặt thêm các thuật toán cải tiến để nâng cao hiệu quả về mặt xử lý và không gian lưu trữ trong bộ nhớ máy tính, đồng thời phát triển giao diện chương trình cho phù hợp và thuận tiện sử dụng hơn.

Trang 34

TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] TS.Đỗ Phúc, Giáo trình Khai thác dữ liệu, Đại học quốc gia TP.Hồ CHí Minh-Trường đại học Cơng nghệ thông tin, NXB đại học Quốc gia TP.Hồ Chí Minh, 2008.

[2] Hồng Kiếm, Đỗ Văn Nhơn, Đỗ Phúc, Giáo trình các hệ cơ sở tri thức, NXB Đại học Quốc gia TP. Hồ Chí Minh, 2002.

[3] Trần Đức Quang, Nguyên lý các hệ Cơ sở dữ liệu và Cơ sở tri thức, Tập 3 (biên dịch từ bản gốc của Jeffrey D. Ullman), NXB Thống kê, 2000.

Tiếng Anh

[4] Rakesh Agrawal and Ramakrishnan Srikant, Fast Algorithms for mining association rules, IBM almaden Research Center.

[5] Li Pingxiang- Chen Jiangping-Bian Fuling, A developed algorithm of apriori based on association analysis, WuHan University.

[6] Jen-Ting Tony Hsiao-Alexandros Ntoulas, Data Mining Association Rules. [7] Rakesh Agrawal-Tomasz Imielinski-Arun Swami, Mining Association Rules between Sets of Items in Large Databases.

Trang 35

PHỤ LỤC

HƯỚNG DẪN CÀI ĐẶT PHẦN MỀM 1. Cài đặt phần mềm

Bước 1: Double click file setup trong thư mục PROGRAM.

Bước 2: Chọn Next

Trang 36

Chọn nút Browse để chọn thư mục( ví dụ cài vào thư mục D:\test)

Bước 4: Chọn Next, Next để cài đặt.

Trang 37

Sau khi cài xong, thư mục TEST có 2 file

Màn hình Destop có shortcut

2. Cài đặt cơ sở dữ liệu

Dữ liệu sử dụng trong thư mục DATA

Sử dụng hệ quản trị SQL Server 2008 để quản lý cơ sở dữ liệu. Bước 1: Chép thư mục DATA vào thư mục D:\TEST

Bước 2: Kết nối hệ quản trị SQL Server 2008

Trang 38

Bước 4: Nhấn chuột phải trên Databases chọn Attach

Bước 5: Chọn nút Add

Trang 39

3. Khởi động phần mềm

Doudle click vào file Apriori trong thư mục TEST hoặc doudle click vào shortcut Apriori trên màn hình Destop.

Danh mục các học phần