1. Trang chủ
  2. » Thể loại khác

Khai thác luật kết hợp từ cơ sở dữ liệu giao dịch của siêu thị bán lẻ : Luận văn ThS. Công nghệ thông tin: 60 48 05

73 22 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 73
Dung lượng 2,74 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN KHẮC GIÁO KHAI THÁC LUẬT KẾT HỢP TỪ CƠ SỞ DỮ LIỆU GIAO DỊCH CỦA SIÊU THỊ BÁN LẺ LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2013 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN KHẮC GIÁO KHAI THÁC LUẬT KẾT HỢP TỪ CƠ SỞ DỮ LIỆU GIAO DỊCH CỦA SIÊU THỊ BÁN LẺ Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60 48 05 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: GS.TS Vũ Đức Thi Hà Nội - 2013 LỜI CẢM ƠN Tơi xin bày tỏ lịng biết ơn sâu sắc đến: - GS.TS Vũ Đức Thi - Viện Công nghệ thông tin, Viện Hàn lâm Khoa học Công nghệ Việt Nam, người thày tận tình hướng dẫn, bảo tơi hồn thành tốt luận văn - Các thày cô giáo Khoa Công nghệ thông tin - Trường Đại học Công nghệ tận tâm giảng dạy, truyền đạt cho kiến thức, phương pháp nghiên cứu suốt hai năm học - Các thày cô, anh chị viện Công nghệ thông tin, Viện Hàn lâm Khoa học Công nghệ Việt Nam giúp đỡ nhiều trình nghiên cứu Cuối xin cảm ơn gia đình bạn bè giúp đỡ động viên, tạo điều kiện thuận lợi cho suốt thời gian nghiên cứu Hà Nội, tháng năm 2013 Nguyễn Khắc Giáo LỜI CAM ĐOAN Tôi xin cam đoan luận văn "Khai thác luật kết hợp từ sở liệu giao dịch siêu thị bán lẻ" công trình nghiên cứu tơi hướng dẫn khoa học GS.TS Vũ Đức Thi Các số liệu, kết tham khảo luận văn xác trích dẫn đầy đủ tài liệu tham khảo Phần ứng dụng thực tiễn cá nhân tự thực Tôi xin chịu trách nhiệm luận văn Nguyễn Khắc Giáo MỤC LỤC Danh mục hình vẽ MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 11 1.1 Nhu cầu khai phá liệu 11 1.2 Định nghĩa khai phá liệu 12 1.3 Các ứng dụng khai phá liệu 13 1.4 Các bước trình khai phá liệu 14 1.5 Kiến trúc hệ thống khai phá liệu 17 1.6 Kiểu liệu khai phá liệu 18 1.7 Các toán khai phá liệu điển hình 19 1.7.1 Mô tả khái niệm 19 1.7.2 Quan hệ kết hợp 20 1.7.3 Phân lớp (phân loại – classification) 20 1.7.4 Phân cụm (clustering) 20 1.7.5 Hồi quy (regression) 20 1.7.6 Mơ hình hóa phục thuộc (dependency modeling) 21 1.7.7 Phát biến đổi độ lệch (change and deviation detection) 21 1.8 Lợi khai phá liệu so với phương pháp 22 1.8.1 Học máy (Machine Learning) 22 1.8.2 Phương pháp hệ chuyên gia 23 1.8.3 Phát kiến khoa học 23 1.8.4 Phương pháp thống kê 23 1.9 Thách thức ứng dụng nghiên cứu kỹ thuật khai phá liệu 24 1.9.1 Các vấn đề CSDL 24 1.9.2 Một số vấn đề khác 26 1.10 Tình hình ứng dụng khai phá liệu 27 CHƯƠNG KHAI PHÁ DỮ LIỆU BẰNG LUẬT KẾT HỢP 29 2.1 Một số khái niệm 29 2.1.1 Độ hỗ trợ (support) 29 2.1.2 Tập phổ biến 29 2.1.3 Luật kết hợp 30 2.2 Phát biểu tốn tìm luật kết hợp 31 2.2 Một số hướng tiếp cận khai phá luật kết hợp 33 2.3 Một số thuật toán phát luật kết hợp 35 2.3.1 Thuật toán Apriori 35 2.3.2 Thuật toán FP-Growth 40 CHƯƠNG TÌM LUẬT KẾT HỢP TRONG CƠ SỞ DỮ LIỆU GIAO DỊCH CỦA SIÊU THỊ BÁN LẺ 50 3.1 Bài tốn tìm luật kết hợp sở liệu giao dịch siêu thị bán lẻ 50 3.1.1 Giới thiệu toán 50 3.1.2 Thuật toán khai phá tập mục cổ phần cao AFSM – Advanced Fast Share Measure) 51 3.2 Xây dựng chương trình khai phá luật kết hợp sở liệu giao dịch siêu thị bán lẻ 59 3.2.1 Dữ liệu đầu vào 59 3.2.2 Giao diện chương trình 61 3.2.3 Thử nghiệm chương trình 66 3.2.4 Nhận xét 69 KẾT LUẬN 70 Kết đạt 70 Hướng nghiên cứu 70 TÀI LIỆU THAM KHẢO 72 Danh mục hình vẽ Hình 1.1 Tiến hóa cơng nghệ Cơ sở liệu 12 Hình 1.2 Quá trình phát tri thức CSDL 14 Hình 1.3 Quy trình phát tri thức 15 Hình 1.4 Kiến trúc điển hình hệ thống khai phá liệu 17 Hình 2.1 Tính chất Apriori tập mục phổ biến 36 Hình 2.2 Nhánh tập cha không phổ biến sinh từ tập không phổ biến 36 Hình 2.3 Ví dụ minh họa thuật toán Apriori 39 Hình 3.1 Kết ví dụ thuật tốn AFSM 57 Hình 3.2 Sơ đồ khối thuật toán AFSM 58 Hình 3.3 Dữ liệu dạng bảng 59 Hình 3.4 Dữ liệu dạng CSDL 60 Hình 3.5 Dữ liệu dạng Text 61 Hình 3.6 Form Giao diện 63 Hình 3.7 Form kết 64 Hình 3.8 Giao diện mở file liệu 65 Hình 3.9 Cảnh báo lỗi nhập thiếu thơng tin 65 Hình 3.10 Cảnh báo lỗi chọn sai liệu 66 MỞ ĐẦU Ngày nay, với phát triển nhanh chóng cơng nghệ thơng tin, tin học ứng dụng nhiều mặt kinh tế, đời sống xã hội Kéo theo khối lượng liệu đồ sộ lưu trữ hệ thống sở liệu, kho liệu Chúng ta biết khối lượng liệu khổng lồ ẩn chứa giá trị định Chẳng hạn như, tập liệu thông tin khám bệnh bệnh nhân bệnh viện vùng cho biết mối liên quan triệu chứng bệnh hay xảy ra: người bị nhức đầu thường hay bị sốt, người bị ho thường bị rát họng ;Cơ sở liệu giao dịch siêu thị ẩn chứa thơng tin thói quen mua hàng khách hàng siêu thị: khách hàng mua bánh mì thường mua sữa, khách hàng mua sữa bột thường mua bỉm, quần áo trẻ sơ sinh ; Lịch sử duyệt web người dùng ẩn chứa thơng tin thói quen lướt web người v.v Việc tìm quy luật thực phương pháp thống kê làm việc với sở liệu vô lớn phương pháp thống kê trở nên khó thực vô tốn Nhu cầu khai thác tri thức từ liệu ngày lớn làm cho khuynh hướng kỹ thuật đời: phát tri thức khai phá liệu KDD (Knowledge Discovery and Data Mining) Phát tri thức sở liệu q trình khơng tầm thường nhận mẫu có giá trị, mới, hữu ích tiềm hiểu liệu KDD kế thừa phát triển thành tựu nhiều lĩnh vực nghiên cứu ứng dụng tin học trước như: Hệ chun gia, Trí tuệ nhân tạo, lý thuyết nhận dạng, … KDD ứng dụng rộng rãi nghiên cứu khoa học, đời sống trị xã hội kinh tế: nghiên cứu thiên văn học, tin sinh học, phát gian lận, khai thác mạng xã hội, văn bản, phát tội phạm, phát lừa đảo, hỗ trợ định, quản lý rủi ro Hiện nay, thói quen mua sắm người tiêu dùng đô thị dần thay đổi Với hệ thống siêu thị rộng khắp, thuận tiện an toàn hơn, người tiêu dùng chuyển sang mua sắm siêu thị nhiều Nhờ việc ứng dụng tin học vào công tác quản lý, giao dịch mua sắm khách hàng lưu lại sở liệu siêu thị Vấn đề đặt là, người quản lý siêu thị tìm thấy tri thức từ kho liệu giao tác khổng lồ kia? Họ mong muốn tìm từ quy luật mua sắm khách hàng để điều phối, xếp hàng hóa cách phù hợp Bài tốn tìm lời giải phương pháp khai phá luật kết hợp thực bảng sở liệu giao tác (giao dịch mua hàng) Trước đây, bảng liệu đầu vào thể việc có hay khơng thực giao tác (ví dụ mặt hàng bán ghi 1, không bán ghi 0), bảng liệu thể số lượng giao tác (mặt hàng không bán ghi 0, mặt hàng bán ghi số lượng mặt hàng bán Điều dẫn tốn đến sát thực tiễn có ý nghĩa thực tiễn tốn Nhưng mà làm biến đổi nhiều đặc tính liệu Do nhiều nhà khoa học tiến hành nghiên cứu bảng liệu giao tác có số lượng để tìm quy luật cho việc tìm kiếm tập mục phổ biến bảng giao tác có số lượng nhanh Trong luận văn này, chọn cách nghiên cứu xây dựng thực nghiệm với toán khai thác luật kết hợp từ sở liệu siêu thị bán lẻ mà giao dịch không đơn thể dạng nhị phân mà có số lượng hàng hóa mua giao dịch Nội dung luận văn gồm chương: Chương 1: Tổng quan khai phá liệu Nêu kiến thức khai phá liệu phát tri thức sở liệu: - Một số định nghĩa khai phá liệu - Các phương pháp khai phá liệu phổ biến ứng dụng chúng - Khuynh hướng phát triển khai phá liệu Chương 2: Khai phá liệu luật kết hợp - Giới thiệu toán khai phá luật kết hợp, khái niệm liên quan phương pháp khai phá luật kết hợp - Giới thiệu số thuật toán sử dụng để khai phá luật kết hợp Chương 3: Tìm luật kết hợp sở liệu giao dịch siêu thị bán lẻ Mô tả tốn thực nghiệm tìm tập luật kết hợp thể thói quen mua sắm khách hàng từ tập sở liệu giao dịch mua bán siêu thị bán lẻ Trong đó: - Mơ tả khác biệt sở liệu bán lẻ siêu thị so với bảng liệu nhị phân 10 - Giới thiệu số cách giải mà nhà khoa học cơng bố - Xây dựng phần mềm tìm luật kết hợp dựa phương pháp AFSM 59 3.2 Xây dựng chương trình khai phá luật kết hợp sở liệu giao dịch siêu thị bán lẻ 3.2.1 Dữ liệu đầu vào Dữ liệu toán khai phá luật kết hợp sở liệu giao dịch bán lẻ siêu thị giao dịch mua bán khách hàng với siêu thị để tìm luật có ý nghĩa thể thói quen mua hàng phổ biến đơng đảo người tiêu dùng Để thuận tiện cho người sử dụng chương trình, liệu đầu vào chương trình xây dựng theo ba dạng chuẩn sau đây:  Dữ liệu dạng bảng: o Dữ liệu hỗ trợ kiểu lưu trữ dạng bảng giao tác o Dạng file lưu trữ: Access 2003 File (*.mdb) o Tên file: o Tên bảng chứa liệu: Table1 o Định dạng liệu: bố cục liệu dạng bảng n dòng, m cột o Mỗi cột đại diện cho item (mặt hàng) o Mỗi dòng giao dịch (transaction) o Mỗi giao dịng cột chứa giá trị số tự nhiên Item không bán giao dịch chứa giá trị 0, ngược lại ô ghi giá trị số lượng item bán giao dịch Hình 3.3 Dữ liệu dạng bảng 60  Dữ liệu CSDL o Mô cấu trúc sở liệu phần mềm quản lý bán hàng thơng thường Chương trình tự động đọc chuyển dạng liệu dạng khai phá luật kết hợp o Dạng file lưu trữ: Access 2003 File (*.mdb) o Tên file: o Tên bảng chứa liệu: chứa tối thiểu bảng: DMHang, ChitietPX, PhieuXuat… Hình 3.4 Dữ liệu dạng CSDL  Dữ liệu dạng Text o Nhằm giải nhược điểm giới hạn số lượng dòng cột file access, liệu sau làm sạch, trích chọn bảng giao tác lưu nội dung dạng file Text (*.txt) loại định dạng file phổ biến nhất, dễ thao tác o Dạng file lưu trữ: Text File (*.txt) o Tên file: o Định dạng liệu: bố cục liệu dạng bảng n dòng, m cột, cột cách khoảng trắng o Mỗi cột đại diện cho item (mặt hàng) o Mỗi dòng giao dịch (transaction) o Mỗi giao dịng cột chứa giá trị số tự nhiên Item không bán giao dịch chứa giá trị 0, ngược lại ô ghi giá trị số lượng item bán giao dịch 61 Hình 3.5 Dữ liệu dạng Text Chương trình cịn cung cấp thêm tính khai phá tập mục phổ biến luật kết hợp cho tập mục phổ biến để đa dạng thêm khả ứng dụng phần mềm, đồng thời cho thấy so sánh với khai phá tập mục cổ phần cao bảng liệu 3.2.2 Giao diện chương trình Giao diện chương trình xây dựng đơn giản trực quan để sử dụng cách dễ dàng Chương trình có form: form giao diện form kết quả: a Form Giao diện Form main chương trình chia làm vùng chính:  Vùng chứa nút Nhập liệu gồm: - Nút “Chọn liệu bảng”: để chọn CSDL dạng bảng - Nút “Chọn liệu CSDL”: để chọn CSDL dạng đầy đủ 62 - Nút “Chọn liệu dạng Text” để chọn CSDL dạng file *.txt  Vùng giũa hiển thị bảng giao tác: dù chọn CSDL dạng sau phần mềm đưa hiển thị thông tin thành bảng giao tác  Vùng chứa nút điều khiển lựa chọn khai phá như: - Chọn kiểu khai phá “Cổ phần cao”, “Nhị phân” để tiến hành khai phá bảng liệu theo kiểu có quan tâm đến số lượng hàng hóa giao tác (cổ phần) hay quan tâm đến xuất hàng hịa giao tác (nhị phân) - Nút “Tính”: thực tính tốn để tìm tập mục thỏa mãn sinh luật kết hợp - Hai ô Textbox nhập ngưỡng cổ phần tối thiểu (ngưỡng hỗ trợ tối thiểu kiểu khai phá nhị phân) ngưỡng độ tin cậy tối thiểu luật kết hợp - Giao diện chương trình cịn có vùng hiển thị thời gian thực thuật toán, thời điểm bắt đầu kết thúc thuật tốn Để sử dụng chương trình, người sử dụng chọn liệu chuẩn bị theo định dạng nêu Dữ liệu tải hiển thị vào vùng (datagridview) cửa sổ chương trình Sau đó, người sử dụng chọn kiểu khai phá, nhập thông số ngưỡng cổ phần (hay ngưỡng độ hỗ trợ) ngưỡng tin vào hai ô textbox phần form Nếu khơng nhập đủ thơng số, chương trình khơng hoạt động có thơng báo cần nhập đủ thơng tin chỗ bị thiếu Nhấn nút “Tính” để thuật tốn hoạt động Kết gồm tập mục cổ phần cao (hoặc tập mục phổ biến) tập luật mạnh tương ứng hiển thị form kết 63 Hình 3.6 Form Giao diện 64 b Form kết Hình 3.7 Form kết 65 c Một số thơng báo sử dụng chương trình Hình 3.8 Giao diện mở file liệu Hình 3.9 Cảnh báo lỗi nhập thiếu thơng tin 66 Hình 3.10 Cảnh báo lỗi chọn sai liệu 3.2.3 Thử nghiệm chương trình Thu thập liệu Dữ liệu thu thập từ siêu thị, công ty bán lẻ, thông tin hóa đơn với mặt hàng mua hóa đơn gồm tên hàng, số lượng hàng Dùng chương trình khai phá tập mục cổ phần cao để tìm mặt hàng mua nhiều thói quen mua sản phẩm có mối liên quan với khách hàng Nhờ tư vấn giúp người quản lý định hướng kinh doanh Ngồi 67 sử dụng liệu có số thơng tin đặc thù để khai phá sở liệu thông tin lỗi viễn thông (thống kê lỗi hay xảy mối liên quan chúng), … Tạo sở liệu Dữ liệu chuẩn bị để kiểm thử chương trình gồm ba dạng trình bày Trong đó: - Dạng sở liệu đầy đủ: file CSDL nhỏ mang tính chất minh họa - Dữ liệu lớn lưu file txt gồm file sau: Tên tệp Số giao tác Số mục liệu Test1.txt Test2.txt Test3.txt 1000 10000 50000 20 50 50 Cấu hình máy kiểm thử: Máy tính 1: - Proccessor: Intel Pentium IV 3.0GHz - Memory: 3328MB RAM - Hệ điều hành: Window XP SP2 32bit Máy tính 2: - Proccessor: Intel Core™ i7 – 2670QM 2.20GHz - Memory: 6G RAM - Hệ điều hành: Window Enterprise 64bit Kết kiểm thử: File liệu Test1.txt Test1.txt Test2.txt Test2.txt Ngưỡng Ngưỡng Số tập cổ phần tin cậy mục cổ (%) (%) phần cao 10 10 10 160 10 10 80 Số luật 373 Thời gian Thời gian tính tính (Máy tính 1) (Máy tính 2) 1s 0.4s 3s 3.5s 44s 31.3s 41s 31.5s 68 Test2.txt Test3.txt Test3.txt Test3.txt 20 10 50 80 80 50 108 0 222 0 10m15s 28s 4m6s 7m10s 7m58s 19s 2m58s 6m23s Khi thực so sánh khai phá luật theo cổ phần cao khai phá luật kết hợp theo tập phổ biến liệu sử dụng máy tính 2, ta có kết sau: Bảng nhị phân kích thước 10 tập mục, 700 giao tác (file Table2.mdb): - Ngưỡng cổ phần (độ hỗ trợ) 40% , ngưỡng tin cậy 50% Kiểu khai phá Cổ phần cao Tập phổ biến Thời gian thực 0.174s 0.0271s Số tập mục thỏa mãn Số luật mạnh 28 - Ngưỡng cổ phần (độ hỗ trợ) 20% , ngưỡng tin cậy 50% Kiểu khai phá Cổ phần cao Tập phổ biến Thời gian thực 0.45s 0.401s Số tập mục thỏa mãn 20 31 Số luật mạnh 148 158 Bảng giao tác có số lượng, kích thước 20 tập mục, 183 giao tác (file Table3.mdb): - Ngưỡng cổ phần (độ hỗ trợ) 30%, ngưỡng tin cậy 50% Kiểu khai phá Cổ phần cao Tập phổ biến Thời gian thực 0.024s 0.034s Số tập mục thỏa mãn 10 Số luật mạnh 14 - Ngưỡng cổ phần (độ hỗ trợ) 10% , ngưỡng tin cậy 10% Kiểu khai phá Cổ phần cao Tập phổ biến Thời gian thực 0.455s 0.422s Số tập mục thỏa mãn 57 79 Số luật mạnh 606 628 69 3.2.4 Nhận xét Qua thực nghiệm cho thấy, kết khai phá luật kết hợp từ bảng liệu theo khía cạnh cổ phần cao theo khía cạnh tập mục phổ biến cho kết khác Điều liệu dạng bảng nhị phân liệu dạng bảng giao tác có số lượng 70 KẾT LUẬN Kết đạt Luận văn "Khai thác luật kết hợp từ sở liệu giao dịch siêu thị bán lẻ" đạt số kết sau:  Chương giới thiệu khái quát khái niệm “Khai phá liệu” số vấn đề liên quan như: định nghĩa, ứng dụng, bước tiến hành, kiến trúc hệ thống khai phá liệu, kiểu liệu tốn điển hình khai phá liệu, lợi khó khăn khai phá liệu so với phương pháp khác,  Chương giới thiệu “Khai phá luật kết hợp”, khái niệm Khai phá luật kết hợp như: độ hỗ trợ, độ tin cậy, tập mục phổ biến, luật kết hợp, luật mạnh Chương giới thiệu dạng toán khai phá luật kết hợp khác số phương pháp kinh điển khai phá luật kết hợp nhị phân Apriori, FP-Tree  Chương giới thiệu toán “Khai thác luật kết hợp từ sở liệu giao dịch siêu thị bán lẻ”, khác biệt toán với toán khai phá luật kết hợp bảng nhị phân điển hình dẫn tới việc áp dụng phương pháp khai phá tập mục phổ biến cho loại toán Chương giới thiệu khái niệm tập mục cổ phần cao, định nghĩa liên quan cổ phần, ngưỡng cổ phần, tập mục cổ phần theo giao tác cao, Chương giới thiệu thuật toán khai phá tập mục cổ phần cao để giải toán luận văn Cuối chương phần giới thiệu kết thực nghiệm xây dựng phần mềm khai thác luật kết hợp từ sở liệu giao dịch siêu thị bán lẻ Vì Khai phá liệu luật kết hợp nói riêng khai phá liệu nói chung vấn đề rộng lớn, nên hẳn nghiên cứu nhỏ em nhiều thiếu sót, phần thực nghiệm cịn dạng thử nghiệm thuật tốn, cần cải thiện thêm trở thành sản phẩm thực tiễn Em mong nhận góp ý giúp đỡ thày bạn để đề tài ngày hoàn thiện Em xin chân thành cảm ơn! Hướng nghiên cứu Tiếp tục hồn thiện phần mềm để trở thành sản phẩm thương mại Nghiên cứu đưa thêm yếu tố giá trị sản phẩm, trọng số cho sản phẩm vào phần mềm để đáp ứng nhu cầu khác khách hàng 71 Phát triển thuật toán song song để khai phá luật kết hợp Xây dựng chế khai phá luật kết hợp theo thời gian nhằm tận dụng kết khai phá trước để khơng cần phải khai phá lại từ đầu, tránh lãng phí Cách làm sở liệu gia tăng (tăng số lượng giao tác hay tăng số lượng tập mục), việc khai phá luật kết hợp phải thực lại từ đầu, chưa thể kế thừa kết lần khai phá trước thực  72 TÀI LIỆU THAM KHẢO Tiếng Việt Nguyễn Huy Đức (2003), "Khai phá luật kết hợp sở liệu lớn", Kỷ yếu Hội thảo khoa học Quốc gia lần thứ nghiên cứu ứng dụng CNTT, Hà Nội, 10/2003,tr.128-136 Nguyễn Huy Đức (2009), Khai phá tập mục cổ phần cao lợi ích cao sở liệu, Luận án Tiến sĩ tốn học – viện Cơng nghệ thơng tin Phan Xuân Hiếu, Bài giảng Khai phá liệu Kho liệu, Đại học Công nghệ, Đại học Quốc Gia Hà Nội Vũ Đức Thi (1997), Cơ sở liệu - Kiến thức thực hành, NXB Thống Kê, Hà Nội Vũ Đức Thi, Nguyễn Huy Đức (2008), "Khai phá tập mục thường xuyên cổ phần cao sở liệu lớn", Tạp chí Tin học Điều khiển học, 24(2), tr.168-178 Vũ Đức Thi, Nguyễn Huy Đức (2008), "Thuật toán hiệu khai phá tập mục thường xuyên cổ phần cao", Kỷ yếu Hội thảo Một số vấn đề chọn lọc CNTT TT, Huế, 12/2008, tr.431-444 Hà Quang Thụy (2009), Giáo trình khai phá liệu web, NXB Giáo dục Việt Nam, tr.9-38 Hà Quang Thụy, Bài giảng Nhập môn Khai phá liệu, Đại học Công nghệ, Đại học Quốc Gia Hà Nội Tiếng Anh Agrawal R and Srikant R (1994), "Fast algorithms for mining association rules", Proceedings of 20th International Conference on Very Large Databases, Santiago, Chile 10.Fayyad, Piatetsky-Shapiro, and Smyth (1996), "From Data Mining to Knowledge Discovery in Databases", AI Magazine Volume 17 Number 11.Friedman J H (1998), Data Mining and Statistics: What's the Connection?, Department of Statistics and Stanford Linear Accelerator Center, Stanford 12.Han J and Kamber M (2000), "Mining frequent patterns without candidate generation", ACM SIGMOD Intl Conference on Management of Data, pp.1-12 13.Han J and Kamber M (2006), Data Mining: Concept and Techniques, 2nd ed 73 14 Hilderman R J., Carter C L., Hamilton H J., and Cercon N (1998), "Mining association rules from market basket data using share measures and characterized itemsets", Intl, Joural of Artificial Intelligence Tools, Vol 7, pp 189-220 15 Li Y C., Yeh J S., and Chang C C (2005), "A fast algorithm for mining share-frequent itemsets", Lecture Notes in Computer Science, SpringerVerlag, Germany, Vol.3399, pp.417-428

Ngày đăng: 23/09/2020, 21:04

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w