Bƣớc 1: nhập các giao dịch vào bảng cơ sở dữ liệu giao dịch
Bƣớc 2: nhập 2 giá trị minsupp và minconf. Mặc định chƣơng trình sẽ khởi tạo
Bƣớc 3: nhấn vào nút “Tìm tập phổ biến và luật kết hợp” để chƣơng trình thực hiện khai phá dữ liệu vừa nhập và tìm ra luật cho bài toán.
Bƣớc 4: kết quả chi tiết chƣơng trình gồm 2 phần, phần1 là chi tiết tìm ra các tập
phổ biến của cơ sở dữ liệu, phần 2 là tìm ra các luật từ các tập phổ biến tìm đƣợc ở phần 1.
CHƢƠNG 4 NHẬN XÁT – ĐÁNH GIÁ
Qua môn học này, em đã hiểu rõ đƣợc khai phá dữ liệu là gì , nắm rõ đƣợc cốt lõi của một hệ thống data mining bao gồm những nội dung sau:
- Tổng quan về khai thác dữ liệu (Data Mining) : Các loại tri thức trong cơ sở dữ liệu và kỹ thuật khai thác chúng.
- Trình bày vả khái niệm , định nghĩa, tính chất của luật kết hợp, cách xác định độ hỗ trợ của tập luật và độ tin cậy của nó.
- Đƣa mô hình một bài toán và sau đó khai thác luật kết hợp sau đó đánh giá so sánh các thuật toán.
- Trình bày thuật toán khai thác luật kêt hợp, thuật toán Apriori và cải tiến thuật toán Apriori.
Data mining giúp cho con ngƣời đơn giản hóa việc truy xuất, tìm kiếm thông tin và ra quyết định trong tƣơng lai, giúp cho ngƣời dùng có thể dự đoán đƣợc sản phẩm của mình trong tƣơng lai sẽ nhƣ thế nào và đƣa ra những hƣớng phát triển cho hệ thống dữ liệu.
Ứng dụng của nó rất đa dạng và rộng tới, từ marketing, chống gian lận, giảm giá thành sản xuất, tăng doanh thu, phân tích hành vi sử dung ngƣời dùng internet để target đúng nhu cầu, đúng đối tƣợng hay ứng dụng hỗ trợ ra quyết định, nghiên cứu khoa học đến việc chống khủng bố v.v..
Các công cụ, kỹ thuật data mining có thể trả lời các câu hỏi mà các công cụ truyền thống đòi hỏi rất nhiều thời gian cần thiết để có thể giải đáp đƣợc (thậm chí các cách truyền thống không thể giải đƣợc). Nó có thể tìm thấy đƣợc những thông tin cực kỳ hữu ích mà rất dễ bị bỏ qua hoặc không xem xét đến để có thể dự đoán những xu thế/hành động xảy ra trong tƣơng lai.
Để có thể data mining một cách hiệu quả, con ngƣời cần phải thu thập dữ liệu và định nghĩa lại theo các tiêu chí cần phân tích. Các kỹ thuật data mining có thể cài đặt rất nhanh chóng trên các nền tảng phần mềm, phần cứng phổ thông mà không cần đòi hỏi quá phức tạp.
TÀI LIỆU THAM KHẢO
1. Tài liệu môn học Khai phá dữ liệu của PGS. TS Đỗ Văn Nhơn
2. Lê Hoài Bắc, Võ Đình Bảy (2008) “Khai thác luật thiết yếu từ tập phổ biến đóng”, tập 11 số 1.
3. JEFFREY D.ULLMAN, Nguyên lý các hệ cơ sở dữ liệu và cơ sở tri thức,
tập I và II bản dịch Trần Đức Quang.
4. Daniel T.Larose. An Introduction to Data Mining John Wiley & Sons,2005
5. http://vi.scribd.com/doc/39077684/66/Thu%E1%BA%ADt-toan- Apriori
6. http://bis.net.vn/forums/36.aspx
7. Nguyễn Văn Lân (2008), Kỹ thuật xây dựng ASP.net, tập I, II, III, IV, và V, NXB lao động xã hội, Hà Nội.