Ứng dụng khai phá dữ liệu vào hoạt động marketing của công ty tnhh thương mại và dịch vụ tsg,

79 6 0
Ứng dụng khai phá dữ liệu vào hoạt động marketing của công ty tnhh thương mại và dịch vụ tsg,

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHÓA LUẬN TỐT NGHIỆP ĐỀ TÀI ỨNG DỤNG KHAI PHÁ DỮ LIỆU VÀO HOẠT ĐỘNG MARKETING CỦA CÔNG TY TNHH THƢƠNG MẠI VÀ DỊCH VỤ TSG SINH VIÊN THỰC HIỆN PHẠM THỊ MINH CHÂU HÀ NỘI, NĂM 2013 HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHÓA LUẬN TỐT NGHIỆP ĐỀ TÀI ỨNG DỤNG KHAI PHÁ DỮ LIỆU VÀO HOẠT ĐỘNG MARKETING CỦA CÔNG TY TNHH THƢƠNG MẠI VÀ DỊCH VỤ TSG Giáo viên hƣớng dẫn : Th.s Giang Thị Thu Huyền Sinh viên thực : Phạm Thị Minh Châu Lớp : HTTTB – K12 Khóa : 2009 – 2013 Hệ : Đại học qui Hà Nội, tháng /2013 NHẬN XÉT (Của quan thực tập) Sinh viên Phạm Thị Minh Châu thực tập Công ty TNHH thƣơng mại dịch vụ TSG từ ngày 20/03/2013 đến ngày 27/05/2013.Trong thời gian thực tập, em Châu tuân thủ nội quy, quy chế, thời gian kỷ luật lao động Công ty thực tập sinh Em Châu chăm chỉ, cần cù, ham học hỏi, áp dụng đƣợc kiến thức học vào thực tế công việc hồn thành tốt cơng việc đƣợc giao Khóa luận tốt nghiệp với đề tài “ ứng dụng khai phá liệu vào hoạt động marketing công ty TNHH thƣơng mại dịch vụ TSG” vận dụng sáng tạo lý thuyết vào thực tế mang tính ứng dụng cao hoạt động marketing công ty Hà Nội, Ngày 27 Tháng 05 Năm 2013 Ngƣời nhận xét (Ký tên, đóng dấu) NHẬN XÉT (Của giáo viên hƣớng dẫn) Về mặt: Mục đích đề tài; Tính thời ứng dụng đề tài; Bố cục hình thức trình bầy đề tài; Kết thực đề tài; Ý thức, thái độ sinh viên trình thực đề tài ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… …………………………………………………… ………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… Kết luận : ………… …………………………………………………………………… ………………………………………………………………………………… Hà Nội, ngày tháng năm 2013 Giáo viên hƣớng dẫn (Ký tên) LỜI CẢM ƠN Trƣớc hết em xin gửi lời cảm ơn chân thành sâu sắc tới Ths Giang Thị Thu Huyền, ngƣời định hƣớng đề tài tận tình hƣớng dẫn bảo em suốt thời gian thực khóa luận tốt nghiệp Em xin chân thành cảm ơn thầy cô trƣờng Học viện Ngân Hàng tận tình giảng dạy truyền đạt kiến thức, kinh nghiệm quý báu suốt năm học đại học em Bên cạnh đó, em muốn gửi lời cảm ơn tới anh Bùi Đức Sơn anh, chị công ty TNHH TSG tạo điều kiện nhiệt tình giúp đỡ em thời gian thực tập công ty Cuối em xin gửi biết ơn sâu sắc tới gia đình, bạn bè ngƣời thân ln bên cạnh, động viên, chia sẻ, giúp đỡ em suốt thời gian học tập nghiên cứu trƣờng đại học nhƣ q trình hồn thành khóa luận tốt nghiệp Trong q trình thực khóa luận khơng tránh khỏi thiếu sót, hạn chế, em mong nhận đƣợc góp ý, nhận xét thầy để em hồn thiện khóa luận Em xin chân thành cảm ơn ! Sinh viên thực Phạm Thị Minh Châu DANH MỤC CÁC CHỮ VIẾT TẮT Từ viết tắt Ý nghĩa KPDL Khai phá liệu CSDL Cơ sở liệu KDD Knowledge Discovery in Database TNHH Trách nhiệm hữu hạn SQL Structured Query Language DANH MỤC CÁC HÌNH VẼ Hình 1.1 : Quá trình khám phá tri thức Hình 2.1: Cây FP-tree khởi tạo 32 Hình 2.2: Cây FP-Tree sau đọc giao dịch 33 Hình 2.3: Cây FP-Tree sau đọc giao dịch 33 Hình 2.4: Cây FP-Tree sau đọc giao dịch 34 Hình 2.5 :Cây FP-Tree sau đọc giao dịch 34 Hình 2.6: Cây FP-Tree sau đọc giao dịch 35 Hình 2.7: Cây FP-Tree toàn cục 36 Hình 2.8: Cây Tree0 38 Hình 2.9: Tree{ T} cục tƣơng ứng với CSDL{T} 39 Hình 2.10: Tree{ TD } cục tƣơng ứng với CSDL {TD} 40 Hình 2.11: Tree{ TA } cục tƣơng ứng với CSDL { TA } 41 Hình 2.12: Tree{ TW } cục tƣơng ứng với CSDL { TW} 41 Hình 2.13: Tree{ TW } cục tƣơng ứng với CSDL { D } 42 Hình 2.14: Tree{ A } cục tƣơng ứng với CSDL { A } 43 Hình 2.15: Tree{ W } cục tƣơng ứng với CSDL { W} 44 Hình 3.0 Giao diện phần mềm Weka 46 Hình 3.1: Quá trình thực ứng dụng khai phá luật kết hợp 47 Hình 3.2: Giao diện mở file thongtinkhachhang.csv 49 Hình 3.3: Giao diện remove thuộc tính Ma_KH 50 Hình 3.4: Giao diện tiến hành rời rạc liệu 51 Hình 3.5: Giao diện rời rạc hóa liệu 52 Hình 3.6: Giao diện sau tiến hành rời rạc hóa liệu 53 Hình 3.7: Thiết lập tham số thuật toán Apriori 55 DANH MỤC CÁC BẢNG BIỂU Bảng 2.1 Cơ sở liệu 26 Bảng 2.2 Các tập phổ biến có danh mục 26 Bảng 2.3 Các tập phổ biến có danh mục 27 Bảng 2.4 Các tập phổ biến có danh mục 27 Bảng 2.5 Các tập phổ biến có danh mục 28 Bảng 2.6 Mảng thứ tự danh mục đơn phổ biến f-list 31 Bảng 2.7 CSDL sau xếp theo thứ tự f-list 32 Bảng 2.8 Nội dung CSDL{ T} 39 Bảng 2.9 Nội dung CSDL{ TD } 40 Bảng 2.10 Nội dung CSDL{ TA } 40 Bảng 2.11 Nội dung CSDL{ TW } 41 Bảng 2.12 Nội dung CSDL{ D } 42 Bảng 2.13 Nội dung CSDL{ A } 43 Bảng 2.14 Nội dung CSDL{ W } 43 Bảng 2.15 Kết tập phổ biến thỏa ngƣỡng minSup = 45 Mục lục CHƢƠNG I HOẠT ĐỘNG MARKETING TẠI CÔNG TY TNHH TSG…………………………………………………………………………… …… 1.1 Tổng quan hoạt động marketing 1.1.1 Marketing gì? 1.1.2 Các hoạt động marketing 1.2 Giới thiệu công ty TNHH TSG sản phẩm, dịch vụ công ty 1.2.1 Giới thiệu công ty TNHH TSG 1.2.2 Các sản phẩm dịch vụ công ty 1.2.3 Hoạt động marketing công ty CHƢƠNG II LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU…………………….4 2.1 Khái niệm khai phá liệu 2.1.1 Định nghĩa khai phá liệu 2.1.2 Quá trình khám phá tri thức 2.2 Ứng dụng khai phá liệu 2.3 Các kĩ thuật khai phá liệu 2.3.1 Phân lớp ( phân loại - classification) 2.3.2 Hồi quy ( regression) 2.4 Các phƣơng pháp khai phá liệu 2.4.1 Phƣơng pháp suy diễn / quy nạp 2.4.2 Phƣơng pháp ứng dụng K-láng giềng gần 10 2.4.3 Phƣơng pháp sử dụng định luật 11 2.5 Các phần mềm công cụ khai phá liệu 13 2.5.1 Phân tích số liệu phần mềm R 13 2.5.2 Phân tích số liệu phần mềm weka 14 2.5.3 Phân tích số liệu See5/C5.0 14 2.5.4 Phân tích số liệu DTREG1 15 2.6 Luật kết hợp khai phá liệu 16 2.6.1 Khái niệm 16 2.6.2 Luật kết hợp 17 2.6.3 Một số tính chất liên quan đến hạng mục phổ biến (frequent itemset) 19 2.6.4 Một số hƣớng tiếp cận khai phá luật kết hợp 19 2.7 Một số thuật toán phát luật kết hợp 22 2.7.1 Thuật toán Apriori 22 2.7.2 Phƣơng pháp dựa câu FP-Tree, thuật toán FP- growth 29 CHƢƠNG III ỨNG DỤNG LUẬT KẾT HỢP VÀO HOẠT ĐỘNG MARKETING CỦA CÔNG TY TNHH TSG…………………………………….………………….46 3.1 Cài đặt phần mềm Weka 46 3.2 Phát biểu toán 46 3.3 Quy trình thực 47 3.3.1 Thu thập sở liệu 48 3.3.2 Tiền xử lý liệu 48 3.3.5 Khai phá liệu thuật toán Apriori 53 3.3.6 Đánh giá kết toán 65 DANH MỤC TÀI LIỆU THAM KHẢO ……………………………………………68 Khóa luận tốt nghiệp Hình 3.7: Thiết lập tham số thuật tốn Apriori Phạm Thị Minh Châu – HTTTB – K12 55 Khóa luận tốt nghiệp Kết chạy mơ hình === Run information === Scheme: weka.associations.Apriori -N 100 -T -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -c -1 Relation: thongtinkhachhang- weka.filters.unsupervised.attribute.Remove-R1weka.filters.unsupervised.attribute.Discretize-B3-M-1.0-R2 Instances: 600 Attributes: 15 Gioi_Tinh Thu_nhap Laptop Thiet_bi_mang May_van_phong He_dieu_hanh Phan_mem_dietvirus Ung_dung_vp TK_Dohoa Internet Da_phuong_tien Bao_mat Tich_hop DV_SC_Bduong DV_Tvan === Associator model (full training set) === Phạm Thị Minh Châu – HTTTB – K12 56 Khóa luận tốt nghiệp Apriori ======= Minimum support: 0.45 (270 instances) Minimum metric : 0.9 Number of cycles performed: 11 Generated sets of large itemsets: Size of set of large itemsets L(1): 25 Size of set of large itemsets L(2): 46 Size of set of large itemsets L(3): 29 Size of set of large itemsets L(4): 12 Size of set of large itemsets L(5): Best rules found: Phan_mem_dietvirus=K 315 ==> Bao_mat=K 315 Internet=K 304 ==> He_dieu_hanh=K 304 Internet=C 296 ==> Laptop=C 296 conf:(1) conf:(1) conf:(1) Thu_nhap='(-inf-19.333333]' Phan_mem_dietvirus=K 295 ==> Bao_mat=K 295 conf:(1) Phan_mem_dietvirus=K Internet=K 295 ==> He_dieu_hanh=K 295 conf:(1) He_dieu_hanh=K Phan_mem_dietvirus=K 295 ==> Internet=K 295 conf:(1) He_dieu_hanh=K Bao_mat=K 295 ==> Phan_mem_dietvirus=K 295 conf:(1) He_dieu_hanh=K Phan_mem_dietvirus=K 295 ==> Bao_mat=K 295 conf:(1) Internet=K Bao_mat=K 295 ==> He_dieu_hanh=K 295 Phạm Thị Minh Châu – HTTTB – K12 conf:(1) 57 Khóa luận tốt nghiệp 10 He_dieu_hanh=K Bao_mat=K 295 ==> Internet=K 295 conf:(1) 11 Internet=K Bao_mat=K 295 ==> Phan_mem_dietvirus=K 295 conf:(1) 12 Phan_mem_dietvirus=K Internet=K 295 ==> Bao_mat=K 295 conf:(1) 13 Phan_mem_dietvirus=K Internet=K Bao_mat=K 295 ==> He_dieu_hanh=K 295 conf:(1) 14 He_dieu_hanh=K Internet=K Bao_mat=K 295 ==> Phan_mem_dietvirus=K 295 conf:(1) 15 He_dieu_hanh=K Phan_mem_dietvirus=K Bao_mat=K 295 ==> Internet=K 295 conf:(1) 16 He_dieu_hanh=K Phan_mem_dietvirus=K Internet=K 295 ==> Bao_mat=K 295 conf:(1) 17 Internet=K Bao_mat=K 295 ==> He_dieu_hanh=K Phan_mem_dietvirus=K 295 conf:(1) 18 Phan_mem_dietvirus=K Internet=K 295 ==> He_dieu_hanh=K Bao_mat=K 295 conf:(1) 19 He_dieu_hanh=K Bao_mat=K 295 ==> Phan_mem_dietvirus=K Internet=K 295 conf:(1) 20 He_dieu_hanh=K Phan_mem_dietvirus=K 295 ==> Internet=K Bao_mat=K 295 conf:(1) 21 He_dieu_hanh=C 290 ==> Laptop=C 290 conf:(1) 22 He_dieu_hanh=C 290 ==> Internet=C 290 conf:(1) 23 He_dieu_hanh=C Internet=C 290 ==> Laptop=C 290 conf:(1) 24 Laptop=C He_dieu_hanh=C 290 ==> Internet=C 290 conf:(1) 25 He_dieu_hanh=C 290 ==> Laptop=C Internet=C 290 conf:(1) Phạm Thị Minh Châu – HTTTB – K12 58 Khóa luận tốt nghiệp 26 Internet=C DV_SC_Bduong=C 287 ==> Laptop=C 287 conf:(1) 27 He_dieu_hanh=C DV_SC_Bduong=C 285 ==> Laptop=C 285 conf:(1) 28 He_dieu_hanh=C DV_SC_Bduong=C 285 ==> Internet=C 285 conf:(1) 29 He_dieu_hanh=C Internet=C DV_SC_Bduong=C 285 ==> Laptop=C 285 conf:(1) 30 Laptop=C He_dieu_hanh=C DV_SC_Bduong=C 285 ==> Internet=C 285 conf:(1) 31 He_dieu_hanh=C DV_SC_Bduong=C 285 ==> Laptop=C Internet=C 285 conf:(1) 32 Bao_mat=C 284 ==> Phan_mem_dietvirus=C 284 conf:(1) 33 Thu_nhap='(-inf-19.333333]' Internet=K 284 ==> He_dieu_hanh=K 284 conf:(1) 34 Thu_nhap='(-inf-19.333333]' Internet=C 280 ==> Laptop=C 280 conf:(1) 35 Ung_dung_vp=K Internet=K 278 ==> He_dieu_hanh=K 278 conf:(1) 36 Phan_mem_dietvirus=C Internet=C 276 ==> Laptop=C 276 conf:(1) 37 Laptop=C Bao_mat=C 276 ==> Phan_mem_dietvirus=C 276 conf:(1) 38 Internet=K Da_phuong_tien=K 276 ==> He_dieu_hanh=K 276 conf:(1) 39 He_dieu_hanh=K Da_phuong_tien=K 276 ==> Internet=K 276 conf:(1) 40 Internet=C Bao_mat=C 275 ==> Laptop=C 275 Phạm Thị Minh Châu – HTTTB – K12 conf:(1) 59 Khóa luận tốt nghiệp 41 Internet=C Bao_mat=C 275 ==> Phan_mem_dietvirus=C 275 conf:(1) 42 Thu_nhap='(-inf-19.333333]' Phan_mem_dietvirus=K Internet=K 275 ==> He_dieu_hanh=K 275 conf:(1) 43 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Phan_mem_dietvirus=K 275 ==> Internet=K 275 conf:(1) 44 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Bao_mat=K 275 ==> Phan_mem_dietvirus=K 275 conf:(1) 45 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Phan_mem_dietvirus=K 275 ==> Bao_mat=K 275 conf:(1) 46 Thu_nhap='(-inf-19.333333]' Internet=K Bao_mat=K 275 ==> He_dieu_hanh=K 275 conf:(1) 47 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Bao_mat=K 275 ==> Internet=K 275 conf:(1) 48 Thu_nhap='(-inf-19.333333]' Internet=K Bao_mat=K 275 ==> Phan_mem_dietvirus=K 275 conf:(1) 49 Thu_nhap='(-inf-19.333333]' Phan_mem_dietvirus=K Internet=K 275 ==> Bao_mat=K 275 conf:(1) 50 Phan_mem_dietvirus=C Internet=C Bao_mat=C 275 ==> Laptop=C 275 conf:(1) 51 Laptop=C Internet=C Bao_mat=C 275 ==> Phan_mem_dietvirus=C 275 conf:(1) 52 Internet=C Bao_mat=C 275 ==> Laptop=C Phan_mem_dietvirus=C 275 conf:(1) 53 Thu_nhap='(-inf-19.333333]' Phan_mem_dietvirus=K Internet=K Bao_mat=K 275 ==> He_dieu_hanh=K 275 conf:(1) 54 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Internet=K Phạm Thị Minh Châu – HTTTB – K12 60 Khóa luận tốt nghiệp Bao_mat=K 275 ==> Phan_mem_dietvirus=K 275 conf:(1) 55 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Phan_mem_dietvirus=K Bao_mat=K 275 ==> Internet=K 275 conf:(1) 56 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Phan_mem_dietvirus=K Internet=K 275 ==> Bao_mat=K 275 conf:(1) 57 Thu_nhap='(-inf-19.333333]' Internet=K Bao_mat=K 275 ==> He_dieu_hanh=K Phan_mem_dietvirus=K 275 conf:(1) 58 Thu_nhap='(-inf-19.333333]' Phan_mem_dietvirus=K Internet=K 275 ==> He_dieu_hanh=K Bao_mat=K 275 conf:(1) 59 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Bao_mat=K 275 ==> Phan_mem_dietvirus=K Internet=K 275 conf:(1) 60 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=K Phan_mem_dietvirus=K 275 ==> Internet=K Bao_mat=K 275 conf:(1) 61 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C 274 ==> Laptop=C 274 conf:(1) 62 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C 274 ==> Internet=C 274 conf:(1) 63 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C Internet=C 274 ==> Laptop=C 274 conf:(1) 64 Thu_nhap='(-inf-19.333333]' Laptop=C He_dieu_hanh=C 274 ==> Internet=C 274 conf:(1) 65 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C 274 ==> Laptop=C Internet=C 274 conf:(1) 66 Thu_nhap='(-inf-19.333333]' Internet=C DV_SC_Bduong=C 273 ==> Laptop=C 273 conf:(1) 67 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C DV_SC_Bduong=C 271 ==> Laptop=C 271 conf:(1) Phạm Thị Minh Châu – HTTTB – K12 61 Khóa luận tốt nghiệp 68 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C DV_SC_Bduong=C 271 ==> Internet=C 271 conf:(1) 69 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C Internet=C DV_SC_Bduong=C 271 ==> Laptop=C 271 conf:(1) 70 Thu_nhap='(-inf-19.333333]' Laptop=C He_dieu_hanh=C DV_SC_Bduong=C 271 ==> Internet=C 271 conf:(1) 71 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C DV_SC_Bduong=C 271 ==> Laptop=C Internet=C 271 conf:(1) 72 He_dieu_hanh=C Phan_mem_dietvirus=C 270 ==> Laptop=C 270 conf:(1) 73 He_dieu_hanh=C Phan_mem_dietvirus=C 270 ==> Internet=C 270 conf:(1) 74 He_dieu_hanh=C Phan_mem_dietvirus=C Internet=C 270 ==> Laptop=C 270 conf:(1) 75 Laptop=C He_dieu_hanh=C Phan_mem_dietvirus=C 270 ==> Internet=C 270 conf:(1) 76 He_dieu_hanh=C Phan_mem_dietvirus=C 270 ==> Laptop=C Internet=C 270 conf:(1) 77 Bao_mat=K 316 ==> Phan_mem_dietvirus=K 315 conf:(1) 78 Thu_nhap='(-inf-19.333333]' Bao_mat=K 296 ==> Phan_mem_dietvirus=K 295 conf:(1) 79 Phan_mem_dietvirus=C 285 ==> Bao_mat=C 284 conf:(1) 80 Laptop=C Phan_mem_dietvirus=C 277 ==> Internet=C 276 conf:(1) 81 Laptop=C Phan_mem_dietvirus=C 277 ==> Bao_mat=C 276 conf:(1) 82 Laptop=C Bao_mat=C 276 ==> Internet=C 275 Phạm Thị Minh Châu – HTTTB – K12 conf:(1) 62 Khóa luận tốt nghiệp 83 Phan_mem_dietvirus=C Internet=C 276 ==> Bao_mat=C 275 conf:(1) 84 Laptop=C Phan_mem_dietvirus=C Bao_mat=C 276 ==> Internet=C 275 conf:(1) 85 Laptop=C Phan_mem_dietvirus=C Internet=C 276 ==> Bao_mat=C 275 conf:(1) 86 Phan_mem_dietvirus=C Internet=C 276 ==> Laptop=C Bao_mat=C 275 conf:(1) 87 Laptop=C Bao_mat=C 276 ==> Phan_mem_dietvirus=C Internet=C 275 conf:(1) 88 Internet=C DV_SC_Bduong=C 287 ==> He_dieu_hanh=C 285 conf:(0.99) 89 Laptop=C Internet=C DV_SC_Bduong=C 287 ==> He_dieu_hanh=C 285 conf:(0.99) 90 Internet=C DV_SC_Bduong=C 287 ==> Laptop=C He_dieu_hanh=C 285 conf:(0.99) 91 Laptop=C Phan_mem_dietvirus=C 277 ==> Internet=C Bao_mat=C 275 conf:(0.99) 92 Thu_nhap='(-inf-19.333333]' Internet=C DV_SC_Bduong=C 273 ==> He_dieu_hanh=C 271 conf:(0.99) 93 Thu_nhap='(-inf-19.333333]' Laptop=C Internet=C DV_SC_Bduong=C 273 ==> He_dieu_hanh=C 271 conf:(0.99) 94 Thu_nhap='(-inf-19.333333]' Internet=C DV_SC_Bduong=C 273 ==> Laptop=C He_dieu_hanh=C 271 conf:(0.99) 95 Laptop=C DV_SC_Bduong=C 290 ==> Internet=C 287 conf:(0.99) 96 He_dieu_hanh=K Ung_dung_vp=K 281 ==> Internet=K 278 Phạm Thị Minh Châu – HTTTB – K12 63 Khóa luận tốt nghiệp conf:(0.99) 97 Thu_nhap='(-inf-19.333333]' Laptop=C DV_SC_Bduong=C 276 ==> Internet=C 273 conf:(0.99) 98 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C 274 ==> DV_SC_Bduong=C 271 conf:(0.99) 99 Thu_nhap='(-inf-19.333333]' Laptop=C He_dieu_hanh=C 274 ==> DV_SC_Bduong=C 271 conf:(0.99) 100 Thu_nhap='(-inf-19.333333]' He_dieu_hanh=C 274 ==> Laptop=C DV_SC_Bduong=C 271 conf:(0.99) Kết phần Best rules found - Các luật tốt tìm đƣợc Ví dụ đọc hiểu quy luật: 24 Laptop=C He_dieu_hanh=C 290 ==> Internet=C 290 - conf:(1) Tần suất xuất sản phẩm máy tính xách tay, hệ điều hành thiết bị kết nối internet 290 (giải thích thêm: số lƣợng ghi 600 suy rộng độ hỗ trợ sup = 290/600 = 0.48 > minsup = 0.1 tỷ lệ vừa phải phạm vi sở liệu nhỏ với 600 ghi) - Khả khách hàng sử dụng máy tính xách tay, hệ điều hành thiết bị kết nối internet tƣơng đƣơng với xác suất xảy 100% 41 Internet=C Bao_mat=C 275 ==> Phan_mem_dietvirus=C 275 conf:(1) - Tần suất xuất đồng thời Internet, bảo mật phần mềm diệt virus 275 (giải thích thêm: số lƣợng ghi 600 suy rộng độ hỗ trợ sup = 275/600 = 0.46 > minsup = 0.1 tỷ lệ vừa phải phạm vi sở liệu nhỏ với 600 ghi Phạm Thị Minh Châu – HTTTB – K12 64 Khóa luận tốt nghiệp - Khả khách hàng mua thiết bị kết nối Internet phần mềm bảo mật có sử dụng phần mềm diệt Virus 1, tƣơng đƣơng với xác suất 100% 50 Laptop=C He_dieu_hanh=C 290 ==> DV_SC_Bduong=C 285 conf:(0.98) -Tần suất xuất đồng thời laptop hệ điều hành 290 tần suất xuất dịch vụ sửa chữa bảo dƣỡng 285 (giải thích thêm: số lƣợng ghi 600 suy rộng độ hỗ trợ sup = 290/600 = 0.48 > minsup = 0.1 tỷ lệ vừa phải phạm vi sở liệu nhỏ với 600 ghi) -Khả khách hàng mua laptop hệ điều hành đồng thời sử dụng dịch vụ sửa chữa, bảo dƣỡng 0.98 tƣơng đƣơng với xác suất xảy 98% Các quy luật lại suy tƣơng tự 3.3.6 Đánh giá kết tốn Hai thơng số để đánh giá quy luật độ tin cậy Conf độ hỗ trợ Sup, thấy kết đƣa luật đƣa có tỷ lệ cao từ tin cậy đƣợc  Một số ý nghĩa đƣợc rút từ kết nhận đƣợc: -Từ quy luật 21 cho thấy khách hàng mua sản phẩm máy tính xách tay hệ điều hành chắn mua thiết bị kết nối internet -Từ quy luật 41 cho thấy khách hàng mua thiết bị kết nối internet phần mềm bảo mật chắn mua phần mềm diệt virus - Từ quy luật 50 cho thấy khả 98% khách hàng mua máy tính xách tay, sản phẩm hệ điều hành sử dụng dịch vụ sửa chữa, bảo dƣỡng Tác giả có số khuyến nghị nhƣ sau: - Với khách hàng có thu nhập dƣới 19 triệu cần đƣa sản phẩm laptop, hệ điều hành, thiết bị kết nối internet dịch vụ sửa chữa, bảo dƣỡng Phạm Thị Minh Châu – HTTTB – K12 65 Khóa luận tốt nghiệp - Giới thiệu cho khách hàng mua máy tính xách tay sản phẩm hệ điều hành - Giới thiệu cho khách hàng mua máy tính xách tay, sản phẩm hệ điều hành, thiết bị kết nối internet sử dụng dịch vụ sửa chữa, bảo dƣỡng Với sở liệu nhỏ chƣa đủ để khái quát hết tri thức rút trích đƣợc nhƣ nhƣng chứng tỏ tiềm lớn luật kết hợp khai phá liệu việc giải yêu cầu toán nêu từ đầu Cần lƣu ý luật, có luật khơng phù hợp với thực tế (thậm chí đơi mâu thuẫn) Các luật cung cấp thêm thông tin cho nhân viên marketing việc quảng cáo, giới thiệu sản phẩm khơng phải hồn tồn dựa vào luật cách cứng nhắc Phạm Thị Minh Châu – HTTTB – K12 66 Khóa luận tốt nghiệp KẾT LUẬN Trong trình hồn thành khóa luận này, dù đạt đƣợc kiến thức định, nhƣng em nhận thấy khai phá liệu nói chung luật kết hợp nói riêng lĩnh vực nghiên cứu rộng lớn, nhiều triển vọng Khóa luận trình bày đƣợc vấn đề khai phá liệu luật kết hợp: tầm quan trọng KPDL, hƣớng tiếp cận khai phá liệu, nắm đƣợc kỹ thuật khai phá liệu luật kết hợp, thuật toán phát luật kết hợp Phần thử nghiệm phát đƣợc luật kết hợp phần mềm Weka dựa số liệu thực tế công ty TNHH thƣơng mại dịch vụ TSG sử dụng luật kết hợp hoạt động marketing Qua việc sử dụng phần mềm thử nghiệm khai phá liệu Weka, em nhận thấy công cụ hữu hiệu việc học tập nghiên cứu KPDL Với môi trƣờng làm việc trực quan, sinh động, cơng cụ đƣợc sử dụng dễ dàng nhiều lĩnh vực Khai phá liệu.Bằng việc sử dụng phần mềm Weka, khóa luận đƣa đƣợc luật kết hợp từ dùng hoạt động marketing cơng ty Thuật tốn đƣợc sử dụng để phát luật kết hợp khóa luận thuật tốn Apriori Thuật tốn có ƣu điểm đơn giản, dễ thực hiện, thích hợp với sở liệu vừa nhỏ, phù hợp với liệu công ty Bên cạnh mặt làm đƣợc, khóa luận cịn nhiều thiếu sót Nhƣợc điểm thuật tốn Apriori thích hợp với liệu vừa nhỏ, liệu lớn phân tích nhiều thời gian khơng xác Tuy nhiên, phạm vi nghiên cứu khóa luận, số liệu thử nghiệm có kích thƣớc nhỏ để mơ ứng dụng khai phá liệu toán đƣa Trong thời gian tới, em tiếp tục nghiên cứu luật kết hợp khác phức tạp với số liệu lớn hơn, nhiều thuộc tính để rút luật kết hợp có giá trị Phạm Thị Minh Châu – HTTTB – K12 67 Khóa luận tốt nghiệp DANH MỤC TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt Nguyễn Nhật Quang, giáo trình Khai phá liệu, trƣờng Đại học Bách Khoa Hà Nội,2012 PGS.TS Đỗ Phúc, Bài giảng khai thác liệu, trƣờng Đại học Quốc gia TP Hồ Chí Minh, 2007 Lâm Mạnh Tân, Nghiên cứu khoa học “Ứng dụng datamining vào hoạt động marketing ngân hàng”, khoa Hệ thống thông tin quản lý, Học viện Ngân hàng, 2013 Tập thể tác giả, Bài giảng Khai phá liệu, Đại học Hàng hải Việt Nam, 2011 Tập thể tác giả, giáo trình Marketing bản, Học viện Ngân Hàng,2012 Tài liệu tiếng Anh Max Bramer, Principles of Data Mining, Springer, UK,2007 Jiawei Han and Micheline Kamber, Data Mining : Concepts and Techniques, Morgan Kaufmann Publisher, 2001 Phạm Thị Minh Châu – HTTTB – K12 68 Khóa luận tốt nghiệp Danh mục website http://www.datamining-international.com/ http://bis.net.vn/forums/t/385.aspx https://www.ibm.com/developerworks/vn/library/data/2013Q1/ba-datamining-techniques/ http://voer.edu.vn/module/kinh-te/khai-pha-du-lieu.html http://lib.hiast.edu.vn/xem-tai-lieu/khai-pha-du-lieu-chuong-6-khai-pha-luatket-hop.140284.html http://vi.wikipedia.org/wiki/Khai_phá_dữ_liệu Phạm Thị Minh Châu – HTTTB – K12 69

Ngày đăng: 18/12/2023, 19:06

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan