1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai thác mẫu tuần tự tối đại

59 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khai Thác Mẫu Tuần Tự Tối Đại
Tác giả Nguyễn Ngọc Tuân
Người hướng dẫn PGS.TS. Lê Hoài Bắc
Trường học Trường Đại Học Công Nghệ TP. HCM
Chuyên ngành Công Nghệ Thông Tin
Thể loại Luận Văn Thạc Sĩ
Năm xuất bản 2015
Thành phố TP. HỒ CHÍ MINH
Định dạng
Số trang 59
Dung lượng 894,97 KB

Nội dung

Ngày đăng: 11/07/2021, 16:52

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Congnan Luo, Soon M.Chung, “Effcient mining of maximal sequential patterns using multiple samples“, Proc. 5th SIAM Intern. Conf. Data mining, Newport Beach, CA, 2005, pp.415-426 Sách, tạp chí
Tiêu đề: “Effcient mining of maximal sequential patterns using multiple samples“
[2]. Gomariz, Campos, Marin, Goethals, “ClaSP: An Ecient Algorithm for Mining Frequent Closed Sequences“, Proc. 17th Pacic-Asia Conf. Knowledge Discovery and Data Mining, 2013, pp.50-61 Sách, tạp chí
Tiêu đề: “ClaSP: An Ecient Algorithm for Mining Frequent Closed Sequences“
[3]. Han J, M Kamber, "Data Mining-Concepts and Techniques (Second Edition)" Morgan Kaufman Publishers, 2006 Sách, tạp chí
Tiêu đề: Data Mining-Concepts and Techniques (Second Edition)
[4]. Jay Ayres, Jason Flannick, Johannes Gehrke, Tomi Yiu, “Sequential pattern mining using a bitmap representation“, Proc. 8th ACM Intern. Conf. Knowl.Discov. Data Mining, 2002 Sách, tạp chí
Tiêu đề: “Sequential pattern mining using a bitmap representation“
[5]. JianPei, JiaweiHan, Behzad Mortazavi-Asl, Jianyong Wang, Helen Pinto, Qiming Chen, Umeshwar Dayal, Mei-Chun Hsu, “Mining sequential patterns by pattern-growth: the PrexSpan approach“, IEEE Trans. Known. Data Engin, 2004, pp.1-8 Sách, tạp chí
Tiêu đề: “Mining sequential patterns by pattern-growth: the PrexSpan approach“
[7]. Mohammed J.Zaki, “SPADE: An effcient algorithm for mining frequent sequences“, Machine Learning, 2001, pp.31-60 Sách, tạp chí
Tiêu đề: “SPADE: An effcient algorithm for mining frequent sequences“
[8]. Nancy P.Lin, Wei-Hua Hao, Hung-Jen Chen, Hao-En Chueh, Chung-I Chang, “Fast Mining Maximal Sequential Patterns“, Proc. of the 7th Intern. Conf. on Simulation, Modeling and Optimization, September 15-17, Beijing, China, 2007, pp.404-407 Sách, tạp chí
Tiêu đề: “Fast Mining Maximal Sequential Patterns“
[9]. Nizar R.Mabroukeh, C.I.Ezeife, “A taxonomy of sequential pattern mining algorithms“, ACM Computing Surveys, 2010, pp. 3.1-3.41 Sách, tạp chí
Tiêu đề: “A taxonomy of sequential pattern mining algorithms“
[11] Philippe Fournier-Viger, Antonio Gomariz, Manuel Campos, Rincy Thomas, “Fast Vertical Sequential Pattern Mining Using Co-occurrence Information“. Proc.18th Pacic-Asia Conference on Knowledge Discovery and Data Mining , Springer, LNAI, 2014 Sách, tạp chí
Tiêu đề: “Fast Vertical Sequential Pattern Mining Using Co-occurrence Information“
[12] Philippe Fournier-Viger, Cheng-Wei Wu, Antonio Gomariz, Vincent S.Tseng, “VMSP: Effcient Vertical Mining of Maximal Sequential Patterns“, Proc. 18th Pacic-Asia Conference on Knowledge Discovery and Data Mining , Springer, LNAI, 2014 Sách, tạp chí
Tiêu đề: “VMSP: Effcient Vertical Mining of Maximal Sequential Patterns“
[13] Philippe Fournier-Viger, Cheng-Wei Wu, Vincent S.Tseng, “Mining Maximal Sequential Patterns without Candidate Maintenance“. Proc. 9th Intern. Conference on Advanced Data Mining and Applications, 2013 Sách, tạp chí
Tiêu đề: “Mining Maximal Sequential Patterns without Candidate Maintenance“
[14] Rene A Garcia-Hernandez, Jose Fco Martnez-Trinidad, Jesus Ariel Carrasco- Ochoa,“A new algorithm for fast discovery of maximal sequential patterns in a document collection“, Comp. Linguistics Intelligent Text Processing, 2006 Sách, tạp chí
Tiêu đề: “A new algorithm for fast discovery of maximal sequential patterns in a document collection“
[15] Shen Lu, Chunping Li, “Apriori Adjust: An Effcient Algorithm for Discovering the Maximum Sequential Patterns“, Proc. Intern. Workshop Knowl.Grid and Grid Intell, 2004 Sách, tạp chí
Tiêu đề: “Apriori Adjust: An Effcient Algorithm for Discovering the Maximum Sequential Patterns“
[16] Xifeng Yan, Jiawei Han, Ramin Afshar, “CloSpan: Mining closed sequential patterns in large datasets“, Proc. of the third SIAM International Conference on Data Mining, May 1-3, San Francisco, California, ISBN 0-89871-545-8, 2003 Sách, tạp chí
Tiêu đề: “CloSpan: Mining closed sequential patterns in large datasets“
[17] Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth: From Data Mining toKnowledge Discovery inDatabases, [online], viewed 12 March 2015, from:http://www.aaai.org/Conferences/National/1997/aaai97.htm Link
[6]. Jianyong Wang, Jianwei Han, Chun Li, "Frequent closed sequence mining without candidate maintenance“, IEEE Trans. on Knowledge Data Engineering , 2007,pp.1-8 Khác
[10] Philippe Fournier-Viger, Antonio Gomariz, Manuel Campos, Rincy Thomas, “Fast Vertical Mining of Sequential Patterns Using Co-occurrence Information“ Khác
[18] CRISP-DM 1.0 - Statoo Consulting, [online], viewed 15 March 2015, from:<www.statoo.com/CRISP-DM.pdf&gt Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Quá trình KDD [17] - Khai thác mẫu tuần tự tối đại
Hình 1.1 Quá trình KDD [17] (Trang 17)
Hình 1.2: Qui trình CRISP-DM 09/1996 [18] - Khai thác mẫu tuần tự tối đại
Hình 1.2 Qui trình CRISP-DM 09/1996 [18] (Trang 18)
Bảng 2.1:CSDL chuỗi. - Khai thác mẫu tuần tự tối đại
Bảng 2.1 CSDL chuỗi (Trang 24)
Ví dụ:Hình trên cho thấy 14 mẫu tuần tự được tìm thấy trong cơ sở dữ liệu của bảng2.1 với minsup = 3 và độ hỗ trợ của chúng.Ví dụ, các mẫu ,  ,  - Khai thác mẫu tuần tự tối đại
d ụ:Hình trên cho thấy 14 mẫu tuần tự được tìm thấy trong cơ sở dữ liệu của bảng2.1 với minsup = 3 và độ hỗ trợ của chúng.Ví dụ, các mẫu , , (Trang 25)
Bảng 2.2: Mẫu tuần tự tìm được từ Bảng2.1 (CM-SPADE) - Khai thác mẫu tuần tự tối đại
Bảng 2.2 Mẫu tuần tự tìm được từ Bảng2.1 (CM-SPADE) (Trang 25)
Ví dụ: Xét cơ sở dữ liệu ở bảng2.1 vớiminsu p= 3. Có 14 mẫu tuần tự phổ - Khai thác mẫu tuần tự tối đại
d ụ: Xét cơ sở dữ liệu ở bảng2.1 vớiminsu p= 3. Có 14 mẫu tuần tự phổ (Trang 26)
Bảng 2.4: Mẫu tuần tựtối đại tìm được từ Bảng2.1 (VMSP) - Khai thác mẫu tuần tự tối đại
Bảng 2.4 Mẫu tuần tựtối đại tìm được từ Bảng2.1 (VMSP) (Trang 26)
Bảng 2.5: Trình bày theo chiều dọc CSDL ở Hình 2.1 - Khai thác mẫu tuần tự tối đại
Bảng 2.5 Trình bày theo chiều dọc CSDL ở Hình 2.1 (Trang 30)
Hình 2.4: Khố iZ lọc tối đại. - Khai thác mẫu tuần tự tối đại
Hình 2.4 Khố iZ lọc tối đại (Trang 33)
Bảng 2.6: CMAPi và CMAPs của DBBảng 2.1 vớiminsu p= 3. - Khai thác mẫu tuần tự tối đại
Bảng 2.6 CMAPi và CMAPs của DBBảng 2.1 vớiminsu p= 3 (Trang 35)
CSDL chuỗi như Hình 2.1 thuật giải tuần tự qua các bước vớiminsup =3 (75%): - Khai thác mẫu tuần tự tối đại
chu ỗi như Hình 2.1 thuật giải tuần tự qua các bước vớiminsup =3 (75%): (Trang 36)
Hình 3.1: Sơ đồ cài đặt giải thuật VMSP. - Khai thác mẫu tuần tự tối đại
Hình 3.1 Sơ đồ cài đặt giải thuật VMSP (Trang 40)
Đồng thời kết quả khi tạo Cmap của dữ liệu bảng2.1 với minsup=3 như sau: Bảng 3.1: Cmap tạo được ở bước 5 của VMSP - Khai thác mẫu tuần tự tối đại
ng thời kết quả khi tạo Cmap của dữ liệu bảng2.1 với minsup=3 như sau: Bảng 3.1: Cmap tạo được ở bước 5 của VMSP (Trang 41)
Hình 3.3: Sơ đồ giải thuật đề xuất. - Khai thác mẫu tuần tự tối đại
Hình 3.3 Sơ đồ giải thuật đề xuất (Trang 42)
Với CSDL SID được biểu diễn ở bảng2.1 được biểu diễn lại dạng VDB như bảng 2.5. Xét các mở rộng i-extension và s-extension như sau:  - Khai thác mẫu tuần tự tối đại
i CSDL SID được biểu diễn ở bảng2.1 được biểu diễn lại dạng VDB như bảng 2.5. Xét các mở rộng i-extension và s-extension như sau: (Trang 43)
Bảng 3.2: Cmap tạo đượ cở bước 5 của VMSP++. - Khai thác mẫu tuần tự tối đại
Bảng 3.2 Cmap tạo đượ cở bước 5 của VMSP++ (Trang 43)
Hình 3.5:Kết hợp 2 item theo s-extension - Khai thác mẫu tuần tự tối đại
Hình 3.5 Kết hợp 2 item theo s-extension (Trang 44)
Bảng 4.1: Đặc điểm bộ dữ liệu mẫu - Khai thác mẫu tuần tự tối đại
Bảng 4.1 Đặc điểm bộ dữ liệu mẫu (Trang 46)
Hình 4.1: Thời gian chạy MSNBC Thời gian của thuật giải với bộ dữ liệu Kosarak:  - Khai thác mẫu tuần tự tối đại
Hình 4.1 Thời gian chạy MSNBC Thời gian của thuật giải với bộ dữ liệu Kosarak: (Trang 47)
Hình 4.2: Thời gian chạy Kosarak - Khai thác mẫu tuần tự tối đại
Hình 4.2 Thời gian chạy Kosarak (Trang 47)
Hình 4.3: Bộ nhớ chạy MSNBC Bộ nhớ của thuật giải với bộ dữ liệu Kosarak:  - Khai thác mẫu tuần tự tối đại
Hình 4.3 Bộ nhớ chạy MSNBC Bộ nhớ của thuật giải với bộ dữ liệu Kosarak: (Trang 48)
Hình 4.4: Bộ nhớ chạy Kosarak0.0 - Khai thác mẫu tuần tự tối đại
Hình 4.4 Bộ nhớ chạy Kosarak0.0 (Trang 48)

TỪ KHÓA LIÊN QUAN

w