Khaiphámẫuphổbiến,luậtkếthợpthướcđotươngquan Vũ Mỹ Hạnh Trường Đại học Công nghệ Luận văn Thạc sĩ ngành: Hệ thống thông tin; Mã số: 60 48 05 Người hướng dẫn: TS Nguyễn Công Điều Năm bảo vệ: 2011 Abstract: Tổng quankhaiphámẫuphổbiến,luậtkếthợpthướcđotươngquan Một số phương pháp mở rộng khaipháluậtkếthợp Giới thiệu công cụ khaiphá liệu Weka mô Keywords: Khaiphá liệu; Công nghệ thông tin; Mẫuphổ biến; Luậtkếthợp Content Trong năm gần đây, với phát triển vượt bậc khoa học công nghệ, khả thu thập lưu trữ liệu nâng cao đáng kể, điều đồng nghĩa với việc lượng lớn liệu lưu trữ thiết bị nhớ tăng lên khơng ngừng Cũng mà từ người gặp phải bất cập lớn việc phân tích kho liệu khổng lồ để rút định hữu ích, ứng dụng hầu hết lĩnh vực khoa học, kinh tế, xã hội Khaiphá liệu – Data mining lĩnh vực khoa học liên ngành, nhằm tự động hóa trình khaiphá thơng tin, tri thức hữu ích tiềm ẩn sở liệu tổ chức, doanh nghiệp, Đây lĩnh vực khoa học tiềm năng, mang lại nhiều lợi ích thiết thực, đồng thời thể ưu vượt trội hẳn so với cơng cụ phân tích liệu truyền thống KhaipháMẫuphổ biến – Frequent pattern mining (hay gọi “Mẫu thường xun ”) đóng vai trò thiết yếu khaipháluậtkết hợp, mối tương quan, mối quan hệ thú vị khác liệu Hơn nữa, giúp phân lớp, phân cụm liệu, hỗ trợ tốt nhiệm vụ khaiphá liệu Do vậy, khaiphámẫuphổ biến trở thành nhiệm vụ khaiphá liệu quan trọng chủ đề cần khaiphá tìm kiếm liệu [1] Khaipháluậtkếthợp - Accessociation rule mining kỹ thuật quan trọng khaiphá liệu lần Rakesh Agrawal, Tomas Imielinski, Arun Swami đề xuất năm 1993 Những nghiên cứu luậtkếthợp gần tập trung vào việc xây dựng thuật toán khaipháluậtkếthợp theo hai hướng cải tiến đưa thuật toán cải tiến hiệu thuật toán cũ Trong luận văn tập trung trình bầy khái niệm tổng quankhaiphá liệu, mẫuphổbiến,luậtkếthợp Từ tìm hiểu phương pháp khaiphá tập mục phổ biến sinh ứng viên khaiphákhaipháluậtkếthợp nhị phân Đồng thời, dựa phân tích bất cập phương pháp này, luận văn xem xét số phương phương pháp cải tiến, khaiphá tập mục khơng cần sinh ứng viên, với phân tích đánh giá chi tiết ưu điểm nhược điểm phương pháp Bên cạnh đó, luận văn đề cập đến hướng tiếp cận khác việc khaipháluậtkếthợpkhaipháluậtkếthợp định lượng Đây hướng phát triển để hồn thiện khía cạnh thiếu sót khaipháluậtkếthợp nhị phân Hơn nữa, thướcđotươngquan trình bầy để giúp đánh giá luật đưa có thực mạnh đáng quan tâm hay không Cuối cùng, tìm hiểu cơng cụ Weka sử dụng công cụ để mô phương pháp khaiphá đề cập Luận văn bao gồm ba chương: Chương 1: Tổng quankhaiphámẫuphổbiến,luậtkếthợpthướcđotươngquan Chương 2: Một số phương pháp mở rộng khaipháluậtkếthợp Chương 3: Giới thiệu công cụ khaiphá liệu Weka mô References Tiếng Việt [1] Hà Quang Thụy (Chủ biên), Phan Xn Hiếu, Đồn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2010), Giáo trình Khaiphá liệu Web, NXB Giáo dục Việt Nam Tiếng Anh [2] Jiawei Han (2006), Data mining – Concept and Techniques – 2nd edition [3] Fayyad, Piatetsky-Shapiro, Smyth (1996) From Data Mining to Knowledge Discovery: An Discovery and Data Mining, AAAI Press/ The MIT Press, Menlo Park, CA, 134 [4] J.Han, J.Pei, Y.Yin, and R.Mao (2004), Mining Frequent Patterns without Candidate Generation: A Frequent-pattern Tree Approach Data Mining and Knowledge Discovery [5] Y.Aumann, and Y.Lindell (1999), A statistical theory for quantitative association rules Proc Of the 5th KDD [6] R.Srikant, and R.Agrawal (1996), Mining Quantitative Associatin Rules in Large Rational Tables [7] Rakesh Agrawal and Ramakrishnan Srikant (September 1994) Fast Algorithms for Mining Association Rules In Pro Of the 20th Int’l Conference on Very Large Databases, Santiago, Chile [8] R Agrawal, T.Imielinski, and A.N.Swami (1993), Mining association rules between sets of items in large databases In International Conference on 1993 ACM SIGMOD Inter national Conference on Management of Data, Washington, D.C [9] B Goethals (2003), Survey on Frequent Parttern Mining Technical Report, Helsinki, Institute for Information Technology ... phương pháp khai phá đề cập Luận văn bao gồm ba chương: Chương 1: Tổng quan khai phá mẫu phổ biến, luật kết hợp thước đo tương quan Chương 2: Một số phương pháp mở rộng khai phá luật kết hợp Chương.. .khai phá luật kết hợp nhị phân Hơn nữa, thước đo tương quan trình bầy để giúp đánh giá luật đưa có thực mạnh đáng quan tâm hay khơng Cuối cùng, tìm hiểu... Frequent Patterns without Candidate Generation: A Frequent-pattern Tree Approach Data Mining and Knowledge Discovery [5] Y.Aumann, and Y.Lindell (1999), A statistical theory for quantitative association