Hình 13: Kết quả thực hiện

Một phần của tài liệu MÔ PHỎNG THUẬT TOÁN APRIORI TÌM TẬP PHỔ BIẾN & LUẬT KẾT HỢP (Trang 40)

1/ Kết luận :

Khai phá dữ liệu là một vấn đề quan trọng, nó bao gồm nhiều lĩnh vực và nhiều kỹ thuật khác nhau. Ứng dụng của khai phá dữ liệu là rất lớn và có ích trong mọi hoạt động sản xuất, kinh doanh, chúng giúp cho việc hoạch định chiến lược của các nhà quản lý cũng như hỗ trợ ra quyết định một cách tốt hơn. Trong phạm vi bài tiểu luận này người nghiên cứu đã trình bày được một số điểm như sau:

Về mặt lý thuyết, khai phá dữ liệu là một công đoạn trong tiến trình lớn, tiến trình khám phá tri thức và CSDL. Phương pháp khai phá dữ liệu có thể là phương pháp quy nạp, phương pháp sử dụng cây quyết định và luật, phương pháp phát hiện luật kết hợp, phương pháp phân lớp và hồi quy phi tuyến tính, phương pháp phân nhóm và phân đoạn, phương pháp dựa trên mẫu, phương pháp mô hình phụ thuộc dựa trên đồ thị xác suất,…Các phương pháp trên có thể áp dụng trên dữ liệu thông thường và trên tập mờ. Bài tiểu luận đã trình bày một số kiến thức tổng quan về

AprioriTid, AprioriHybrid và Apriori-DT. Đồng thời cũng đánh giá thời gian thực hiện của các thuật toán thông qua biểu đồ về thời gian để từ đó có thể so sánh được tốc độ nhanh chậm giữa các thuật toán.

Về mặt cài đặt chương trình minh họa, người nghiên cứu đã áp dụng thuật toán tìm tập phổ biến, tìm luật kết hợp để xây dựng nên chương trình Ứng dụng thuật toán Apriori tìm tập phổ biến và luật kết hợp. Với giao diện thân thiện và cách sử dụng đơn giản giúp cho người dùng có được một cách nhìn bao quát và có thể thao tác trên chương trình một cách dễ dàng hơn. Từ đó thấy được ứng dụng của việc tìm ra các luật kết hợp để đáp ứng cho nhu cầu thực tiễn.

Qua bài tiểu luận trên ta thấy được tầm ảnh hưởng quan trọng của việc khai phá dữ liệu trong các lĩnh vực sản xuất, kinh doanh cũng như trong hệ thống các hệ thống siêu thị. Bởi vì bên trong kho dữ liệu to lớn ấy luôn tiềm ẩn những tri thức vô cùng quý giá, cụ thể là việc phát hiện các tri thức mới từ những luật kết hợp. Nó không những giúp cho việc hoạch định chiến lược mà còn hỗ trợ các nhà quản lý ra quyết định trong tương lai. Do đó việc tìm ra các luật kết hợp trong các hệ thống kinh doanh lớn là việc hết sức cần thiết. Tuy nhiên trên thực tế vẫn còn rất nhiều những khó khăn và thử thách trong việc ứng dụng và kết hợp các kỹ thuật khai phá dữ liệu lại với nhau. Vì còn tùy thuộc vào cấu trúc của kho dữ liệu mà chúng ta quyết định lựa chọn những phương án phát hiện tri thức mới dựa vào luật kết hợp sao cho phù hợp.

2/ Hướng phát triển đề tài:

Khai phá dữ liệu là lĩnh vực đã và đang trở thành một trong những hướng nghiên cứu thu hút được sự quan tâm của nhiều chuyên gia về CNTT trên thế giới. Trong những năm gần đây, rất nhiều các phương pháp và thuật toán mới liên tục được công bố. Điều này chứng tỏ những ưu thế, lợi ích và khả năng ứng dụng thực tế to lớn của khai phá dữ liệu.

Bài tiểu luận đã trình bày một số kiến thức tổng quan về khai phá dữ liệu, và trình bày một số thuật toán khai phá luật kết hợp. Tuy nhiên do nhược điểm của thuật toán Apriori là nếu cơ sở dữ liệu càng lớn thì sự phân tích sẽ càng mất rất nhiều thời gian vì vậy để giúp cho việc phát hiện những tri thức mới một cách tối ưu hơn, người nghiên cứu cần tiếp tục nghiên cứu sâu hơn về các thuật toán khai phá luật kết hợp bằng cách áp dụng các cải tiến mới vào thuật toán nhằm khắc phục các nhược điểm của các thuật toán Apriori và đồng thời tùy vào độ phức tạp của dữ liệu mà nên quyết định chọn hoặc kết hợp các thuật toán cho phù hợp như:

Aprioritid, AprioriHybrid hay Apriori-DT. Bên cạnh đó người nghiên cứu cũng cần phải tìm hiểu thêm một số thuật toán khác như: thuật toán FP_Growth, thuật toán Direct Hashing and Pruning, thuật toán song song,… Từ đó giúp cho các nhà quản lý trong các lĩnh vực khác như chứng khoán, bất động sản, y tế, siêu thị…có thể tự tin áp dụng phương pháp này nhằm tìm ra những tri thức mới từ kho dữ liệu đã có để phục vụ vì lợi ích của toàn công ty.

TÀI LIỆU THAM KHẢO

[1] GS.TSKH Hoàng Kiếm. Chuyên đề “Công nghệ tri thức và Ứng dụng” – Trường Đại học Công nghệ thông tin, Đại học quốc gia thành phố Hồ Chí Minh – 2012.

[2] PGS.TS Đỗ Phúc. Bài giảng môn Khai phá dữ liệu và kho dữ liệu – Trường Đại học Công nghệ thông tin, Đại học quốc gia thành phố Hồ Chí Minh – 2012

[3] PGS.TS Đỗ Phúc. Giáo trình Khai thác dữ liệu – Trường Đại học Công nghệ thông tin, Đại học quốc gia thành phố Hồ Chí Minh – 2006.

[5] PGS.TS Hà Quang Thụy. Bài giảng môn Khai phá dữ liệu và kho dữ liệu – Trường Đại học Công nghệ, Đại học quốc gia Hà Nội – 2011.

[6] ThS Nguyễn Trung Tuấn. Kỹ thuật phát hiện tri thức và khai phá dữ liệu, ứng dụng trong bài toán dự báo từ thông tin kinh tế & xã hội – Tạp chí Công nghệ thông tin & Truyền thông.

[7] Lê Minh Trí – Nguyễn Văn Sang. Tiểu luận môn Công nghệ tri thức và ứng dụng - Trường Đại học Công nghệ thông tin, Đại học quốc gia thành phố Hồ Chí Minh - 2012

[8] http://vi.wikipedia.org

[9] http://www.codeding.com/?article=13

[10]http://bis.net.vn

Một phần của tài liệu MÔ PHỎNG THUẬT TOÁN APRIORI TÌM TẬP PHỔ BIẾN & LUẬT KẾT HỢP (Trang 40)