Kết quả cài đặt thuật toán

Một phần của tài liệu Khai phá luật kết hợp mờ và ứng dụng trong cơ sở dữ liệu cước điện thoại (Trang 68)

Giao diện chính của chương trình

Chương trình thực hiện 5 chức năng sau: 1. Xem dữ liệu trong CSDL

2. Hiển thị vùng mờ hóa

3. Hiển thị thuộc tính mờ hóa cùng với giá trị hàm thuộc của chúng 4. Hiển thị các tập mục phổ biến tiềm năng

(1) Xem dữ liệu trong CSDL

Bảng khách hàng

(2) Hiển thị vùng mờ hóa

Giao diện hiển thị vùng mờ của thuộc tính Thời gian đàm thoại

(3) Hiển thị thuộc tính mờ hóa cùng với giá trị hàm thuộc của chúng

Giao diện hiển thị mức độ thuộc của thuộc tính Thời điểm bắt đầu

Giao diện hiển thị mức độ thuộc của thuộc tính Nhóm

(4) Hiển thị các tập mục phổ biến tiềm năng

(5) Hiển thị danh sách các luật tìm được

4.3. Kết luận chương 4

Chương này đã trình bày những vấn đề liên quan đến cài đặt thử nghiệm thuật toán MFAMI trên CSDL cước điện thoại.

• Giới thiệu về nguồn dữ liệu cước điện thoại được sử dụng trong quá trình cài đặt thử nghiệm.

KẾT LUẬN

Những vấn đề đã được giải quyết trong luận văn

Sau một thời gian thu thập tài liệu, khảo sát và phân tích nội dung một số bài báo được đề xuất trong lĩnh vực nghiên cứu về KPDL, bản luận văn này là sự tổng hợp những nét chính trong KPDL nói chung và khai phá luật kết hợp mờ nói riêng. Sau đây là những điểm chính mà luận văn đã tập trung giải quyết.

• Luận văn đã trình bày một cách khái quát về KPDL và KDD.

• Giới thiệu về bài toán “khai phá luật kết hợp”. Bên cạnh việc phát biểu các khái niệm của bài toán, luận văn đề cập đến một số hướng nghiên cứu cụ thể của khai phá luật kết hợp như khai phá luật kết hợp nhị phân, khai phá luật kết hợp có thuộc tính số và thuộc tính hạng mục, khai phá luật kết hợp mờ, .v.v.

• Trình bày về “luật kết hợp mờ” – một dạng luật kết hợp mềm dẻo, gần gũi và tự nhiên hơn với người sử dụng. Ngoài việc phát biểu các khái niệm về tập mờ và phương pháp rời rạc hóa dữ liệu dựa vào tập mờ, luận văn còn tổng hợp một số thuật toán khai phá luật kết hợp mờ. Luận văn trình bày thuật toán khai phá luật kết hợp mờ MFAMI được đề xuất bởi S. Lotfi, M.H. Sadreddini vào năm 2009. Ở các thuật toán trước đây, người dùng phải cung cấp hai giá trị ngưỡng minsup và minconf và với các giá trị khác nhau của hai ngưỡng này thì tập các luật được phát hiện là khác nhau. Ở thuật toán này, người dùng không phải cung cấp bất kỳ giá trị cho ngưỡng nào. Hơn nữa, bằng cách sử dụng khái niệm thông tin tương hỗ trong lý thuyết thông tin, thuật toán còn giới hạn được không gian tìm kiếm bởi không phải tạo ra các tất cả các tập mục phổ biến, mà chỉ xem xét các tập mục phổ biến tiềm năng. Một ưu điểm nữa của thuật toán này là nó có khả năng đánh giá “tính có ích” của các luật tạo ra bằng cách sử dụng sai phân điều chỉnh.

• Cài đặt ứng dụng thuật toán MFAMI vào CSDL cước điện thoại nhằm tìm ra các luật kết hợp có ích. Các luật này là cơ sở để phân lớp khách hàng và đưa ra các chính sách chăm sóc khách hàng thích hợp.

Công việc nghiên cứu trong tương lai

Khai phá luật kết hợp là bài toán được khá nhiều nhà nghiên cứu quan tâm bởi nó được ứng dụng rộng rãi trong các lĩnh vực và có nhiều hướng mở rộng khác nhau. Trong luận văn này, tôi cũng chỉ chọn một hướng nhỏ để nghiên cứu. Trong thời gian tới, tôi sẽ mở rộng nghiên cứu của mình ra một số hướng sau:

• Khai phá song song luật kết hợp mờ. Thuật toán trình bày ở trên và một số thuật toán khác làm việc tương đối tốt với những CSDL có kích cỡ không quá lớn (tiêu chí đánh giá CSDL lớn hay nhỏ phụ thuộc vào số thuộc tính và số bản ghi). Những thuật toán này sẽ giảm tính hiệu quả một cách đáng kể khi gặp phải những CSDL lớn (hàng trăm megabyte trở lên) do hạn chế về dung lượng bộ nhớ trong và tốc độ tính toán của một máy tính đơn lẻ. Với sự phát triển bùng nổ của công nghệ phần cứng, theo đó các hệ máy tính song song có sức mạnh tính toán vượt trội ra đời đã mở ra một hướng tiếp cận mới trong KPDL, đó là KPDL song song.

• Khai phá luật kết hợp mờ với thuộc tính được đánh trọng số. Mục đích của bài toán này là tìm cách gắn trọng số cho các thuộc tính để biểu thị mức độ quan trọng của chúng đối với luật. Ví dụ, khi khai phá luật kết hợp liên quan đến cước điện thoại ở trên thì những thông tin thời gian đàm thoại, giờ bắt đầu gọi và loại cước quan trọng hơn là thông tin về đối tượng khách hàng, do đó chúng được gắn trọng số lớn hơn.

TÀI LIỆU THAM KHẢO

Tài liệu Tiếng Việt

1. Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009), Giáo trình khai phá dữ liệu Web, Nhà xuất bản giáo dục Việt Nam.

2. Nguyễn Thanh Thủy (2001), Khai phá dữ liệu, Nhà xuất bản Kỹ thuật và ứng dụng.

Tài liệu Tiếng Anh

3. Alan Rea (1995), Data Mining – An Introduction. The Parallel Computer Centre, Nor of The Queen’s University of Belfast.

4. Ashish Mangalampalli*, Vikram Pudi (2009), “Fuzzy Association Rule Mining Algorithm for Fast and Efficient Performance on Very Large Datasets”, Centre for Data Engineering (CDE), International Institute of Information Technology (IIIT), Hyderabad, India.

5. Attila Gyenesei (2000), “A Fuzzy Approach for Mining Quantitative Association Rules” Turku Centre for Computer Science, TUCS Technical Reports.

6. Au W-H, Chan KCC (1999), “FARM: a data mining system for discovering fuzzy association rules”, In: Proceedings of 8th IEEE international conference on fuzzy systems, Seoul, Korea.

7. Boris Kovalerchuk and Evgenii Vityaev (2001). Data Mining in Finance: Advances in Relational and Hybrid Methods. Kluwer Academic Publishers, Boston, Dordrecht - London.

8. Bui Quang Minh, Phan Xuan Hieu, Ha Quang Thuy (2002), “Some Parallel Computing Experiments with PC-Cluster”, In Proc. of Conference on IT of Faculty of Technology, VNUH. Hanoi.

9. C. Kuok, A. Fu and H. Wong (1998), “Mining fuzzy association rules in databases”, ACM SIGMOD Record.

10. Chan KCC, Au W (1997), “Mining fuzzy association rules”. In: Proceedings of the sixth international conference on information and knowledge management.

11. Chan Man Kuok, Ada Fu, and Man Hon Wong (1998), “Mining Fuzzy Association Rules in Databases”. Department of Computer Science and Engineering, The Chinese University of Hong Kong, Shatin, New Territories, Hong Kong.

12. D.B. Skilicorn (1999), “Strategies for Parallel Data Mining”, External Technical Report.

13. D.L. Olson, Yanhong Li (2007), “Mining Fuzzy Weighted Association Rules”, Proceedings of the 40th Hawaii International Conference on System Sciences.

14. F. Berzal, I. Blanco, D. S´ anchez, and M.A. Vila (2002), “Measuring the accuracy and interest of association rules: A new framework,” An extension of [9]. Intelligent Data Analysis 6.

15. Fayyad, Piatetsky-Shapiro, Smyth (1996), From Data Mining to Knowledge Discovery: An Overiew. In Fayyad, Piatetsky-Shapiro, Smyth, Uthurusamy, Advances in Knowledge Discovery and Data Mining, AAAI Press/ The MIT Press, Menlo Park, CA.

16. G.V.S.N.R.V.Prasad,Y. Dhanalakshmi, V.Vijaya Kumar, I. Ramesh Babu (2010), “Mining optimised data using clustering along with fuzzy association rules genetic algorithms”, International Journal of Artificial Intelligence and Application (IJAIA), Vol.1, No 2.

17. Gregory Piatetsky-Shapiro (2006), Data Mining Course (Power Point Version)

18. Gyenesei A (2000), “Mining weighted association rules for fuzzy quantitative items”, TUCS Technical Report No. 346

19. Jiawei Han and Micheline Kamber (2006), Data Mining: Concepts and Techniques, University of Illinois, Morgan Kaufmann.

20. Kaya M and Alhajj R (2003), “Facilitating fuzzy association rules mining by using multi-objective genetic algorithms for automated clustering”, In: Proceedings of the third IEEE international conference on data mining.

21. M. Delgado1,N.Mar´ ın, M.J. Mart´ ın-Bautista, D. S´ anchez, M.-A. Vila (2003), “Mining Fuzzy Association Rules: An Overview”,

Department of Computer Science and A.I., University of Granada, Granada, Spain.

22. Mangalampalli, A.Pudi (2008), “Fuzzy Logic-based Pre-processing for Fuzzy Association Rule Mining”, Technical Report IIIT/TR/2008/127, International Institute of Information Technology. 23. Mohammed J. Zaki, Ching-Jui Hsiao (1999), “CHARM: An Efficient

Algorithm for Closed Association Rules Mining”, RPI Technical Report.

24. P. Bosc and O. Pivert (2001), “On some fuzzy extensions of association rules”, Proceedings of IFSA-NAFIPS, Piscataway, NJ, IEEE Press.

25. R. Agrawal, T. Imielinski, and A. Swami (1993), “Mining association rules between sets of items in large databases,” in Proc. Of the 1993 ACM SIGMOD Conference.

26. R. Ladner, F.E. Petry and M.A. Cobb (2003), “Fuzzy set approaches to spatial data mining of association rules”, Transactions in GIS. 27. Rakesh Agrawal, John Shafer (1996), “Parallel mining of association

rules: Design, implementation and experience”, Research Report RJ 10004, IBM Almaden Research Center, San Jose, California.

28. Rakesh Agrawal, Ramakrishnan Srikant (1994), “Fast Algorithms for Mining Association Rules”, In Proc. of the 20th International Conference on Very Large Databases, Santiago, Chile.

29. Ramakrishnan Srikant, Rakesh Agrawal (1995), “Mining Quantitative Association Rules in Large Relational Tables”, IBM Almaden Research Center, San Jose, CA 95120.

30. S. Lotfi, M.H. Sadreddini (2009), “Mining Fuzzy Association Rules Using Mutual Information”, Proceedings of the International MultiConference of Engineers and Computer Scientists 2009 Vol I, IMECS, Hong Kong.

31. T.P. Hong, C.S. Kuo and S.C. Chi (1999), “Mining association rules from quantitative data”, Intell. Data Anal.

Một phần của tài liệu Khai phá luật kết hợp mờ và ứng dụng trong cơ sở dữ liệu cước điện thoại (Trang 68)

Tải bản đầy đủ (PDF)

(79 trang)