Ứng dụng kỹ thuật khai phá dữ liệu vào hoạt động chăm sóc khách hàng tại khách sạn Vọng Cảnh thành phố Huế Đề tài nhằm tìm hiểu lý thuyết khai phá dữ liệu; tìm hiểu phần mềm khai phá dữ liệu WEKA; ứng dụng thuật Đề tài nhằm tìm hiểu lý thuyết khai phá dữ liệu; tìm hiểu phần mềm khai phá dữ liệu WEKA; ứng dụng thuật Đề tài nhằm tìm hiểu lý thuyết khai phá dữ liệu; tìm hiểu phần mềm khai phá dữ liệu WEKA; ứng dụng thuật
ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KINH TẾ KHOA HỆ THỐNG THƠNG TIN KINH TẾ KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU VÀO HOẠT ĐỘNG CHĂM SÓC KHÁCH HÀNG TẠI KHÁCH SẠN VỌNG CẢNH THÀNH PHỐ HUẾ NGUYỄN THỊ THIA KHÓA HỌC 2009-2013 ĐẠI HỌC HUẾ h tế H KHOA HỆ THỐNG THÔNG TIN KINH TẾ uế TRƯỜNG ĐẠI HỌC KINH TẾ họ cK in KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU Đ ại VÀO HOẠT ĐỘNG CHĂM SÓC KHÁCH HÀNG THÀNH PHỐ HUẾ Tr ườ ng TẠI KHÁCH SẠN VỌNG CẢNH Sinh viên thực hiện: Nguyễn Thị Thia Lớp: K43 Tin Học Kinh Tế Niên khóa: 2009-2013 Giáo viên hướng dẫn ThS Dương Thị Hải Phương Tr ườ ng Đ ại họ cK in h tế H uế Huế, tháng năm 2013 LỜI CẢM ƠN Để hồn thành khóa luận tốt nghiệp này, q trình nghiên cứu thực ngồi nổ lực thân cịn có giúp đỡ thầy cơ, gia đình, bạn bè cán nhân viên khách sạn Vọng Cảnh uế Tôi xin trân trọng cám ơn quý thầy cô dạy dỗ suốt tế H năm qua Tôi xin gửi lời cám ơn chân thành đến Cô giáo ThS Dương Thị Hải Phương tận tình hướng dẫn, giúp đỡ tơi suốt thời gian thực h khóa luận in Tiếp đến xin gửi lời cảm ơn đến ban lãnh đạo anh chị Khách sạn Vọng Cảnh nhiệt tình giúp đỡ, tạo điều kiện cho tơi cK hồn thành tốt thời gian thực tập Cuối tơi xin cảm ơn gia đình bạn bè động viên, tạo họ điều kiện để hồn thành khóa luận Tuy nhiên, thời gian có hạn nên khóa luận khơng thể tránh Đ ại khỏi sai sót, kính mong nhận đóng góp ý kiến, bảo thầy để khóa luận hồn thiện Tr ườ ng Tơi xin chân thành cảm ơn! Huế, tháng năm 2013 Sinh viên Nguyễn Thị Thia Khóa luận tốt nghiệp GVHD: Th.S Dương Thị Hải Phương MỤC LỤC MỤC LỤC i uế DANH MỤC HÌNH VẼ v DANH MỤC BẢNG BIỂU vii tế H DANH MỤC CHỮ VIẾT TẮT…………………… ………………………………viii PHẦN I: MỞ ĐẦU 1 Lý chọn đề tài in h Mục tiêu nghiên cứu cK Đối tượng phạm vi nghiên cứu .2 Phương pháp nghiên cứu .2 Cấu trúc khóa luận .3 họ PHẦN II: NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU Đ ại CHƯƠNG I: TỔNG QUAN VỀ KHÁM PHÁ TRI THỨC VÀ KHAI PHÁ DỮ LIỆU4 1.1 Phát tri thức .4 1.1.1 Khái niệm cần thiết phát tri thức ng 1.1.2 Tiến trình thực tri thức ườ 1.2 Khai phá liệu .6 1.2.1 Khái niệm Tr 1.2.2 Quá trình khai phá liệu 1.2.3 Nhiệm vụ khai phá liệu 1.2.4 Phương pháp khai phá liệu .9 1.2.4.1 Cây định luật 1.2.4.2 Phát luật kết hợp .10 Nguyễn Thị Thia i Khóa luận tốt nghiệp GVHD: Th.S Dương Thị Hải Phương 1.2.4.3 Các phương pháp phân lớp hồi quy 10 1.2.4.4 Phương pháp quy nạp/ suy diễn .10 1.2.4.5 Phân nhóm phân đoạn 11 uế 2.2.4.6 Các phương pháp dựa mẫu 11 1.2.4.7 Mơ hình phụ thuộc dựa đồ thị xác suất .12 tế H 1.2.4.8 Mơ hình học quan hệ 12 1.2.4.9 Khai phá liệu dạng văn 13 h 1.2.4.10 Mạng neuron 13 .14 cK 1.2.5 Những ứng dụng khai phá liệu in 1.2.4.11 Giải thuật di truyền 14 CHƯƠNG II: KHAI PHÁ DỮ LIỆU VỚI LUẬT KẾT HỢP VÀ PHÂN CỤM 16 họ 2.1 Luật kết hợp 16 2.1.1 Các khái niệm 16 Đ ại 2.1.1.1 Luật kết hợp 16 2.1.1.2 Độ hỗ trợ 16 2.1.1.3 Độ tin cậy 17 ng 2.1.1.4 Tập mục 17 ườ 2.1.2 Các tính chất 17 2.1.2.1 Tính chất tập mục phổ biến 17 Tr 2.1.2.2 Tính chất luật kết hợp 18 2.1.3 Giới thiệu toán khai phá luật kết hợp 19 2.1.4 Thuật toán Apriori luật kết hợp 21 2.1.4.1 Giới thiệu thuật toán 21 2.1.4.2 Bài toán 1: xác định tập mục phổ biến .22 Nguyễn Thị Thia ii Khóa luận tốt nghiệp GVHD: Th.S Dương Thị Hải Phương 2.1.4.3 Bài toán 2: Sinh luật kết hợp từ tập mục phổ biến 25 2.2 Phân cụm liệu 28 2.2.1 Khái niệm 28 uế 2.2.2 Các yêu cầu thuật toán phân cụm liệu .28 2.2.3 Các kiểu liệu phân cụm .29 tế H 2.2.4 Phép đo độ tương tự khoảng cách kiểu liệu 30 2.2.5 Thuật toán K-means phân cụm liệu 35 h 2.2.5.1 Giới thiệu toán: 35 in 2.2.5.2 Thuật toán K-means 35 CHƯƠNG III: ỨNG DỤNG KHAI PHÁ DỮ LIỆU VÀO HOẠT ĐỘNG CHĂM SÓC cK KHÁCH HÀNG TẠI KHÁCH SẠN VỌNG CẢNH 41 3.1 Tổng quan khách sạn Vọng Cảnh 41 họ 3.1.1 Thông tin chung 41 3.1.2 Quá trình hình thành, cấu tổ chức máy khách sạn 41 Đ ại 3.1.3 Cơ sở vật chất kỹ thuật 42 3.1.4 Chất lượng dịch vụ lưu trú khách sạn 44 ng 3.2 Phần mềm khai phá liệu Weka 46 3.2.1 Giới thiệu chung……………………………………………………………… 42 ườ 3.2.2 Môi trường Explorer 49 Tr 3.2.3 Xây dựng luật kết hợp Weka 49 3.2.4 Xây dựng phân cụm liệu Weka 52 3.3 Ứng dụng khai phá luật kết hợp phân cụm weka vào sở liệu quản lý khách hàng khách sạn Vọng Cảnh 54 3.3.1 Cơ sở liệu toán 54 Nguyễn Thị Thia iii Khóa luận tốt nghiệp GVHD: Th.S Dương Thị Hải Phương 3.3.2 Tiền xử lý liệu toán 54 3.3.3.1 Đặt tham số cho mơ hình 68 3.3.3.2 Kết phân tích 68 uế 3.3.4 Khai thác phân cụm liệu thuật toán K-means 79 tế H 3.3.4.1 Đặt tham số cho mơ hình .79 3.3.4.2 Kết phân tích…………………………………………………… 72 3.4 Một số giải pháp hỗ trợ quản lý khách hàng khách sạn Vọng Cảnh 82 h KẾT LUẬN 85 in DANH MỤC TÀI LIỆU THAM KHẢO 86 Tr ườ ng Đ ại họ cK PHỤ LỤC 87 Nguyễn Thị Thia iv Khóa luận tốt nghiệp GVHD: Th.S Dương Thị Hải Phương DANH MỤC HÌNH VẼ HÌNH 1: TIẾN TRÌNH PHÁT HIỆN TRI THỨC .5 uế HÌNH 2: QUÁ TRÌNH KHAI PHÁ DỮ LIỆU tế H HÌNH 1: MƠ TẢ THUẬT TỐN APRIORI 27 HÌNH 2: SƠ ĐỒ THUẬT TOÁN K-MEANS 36 HÌNH 3: KHỞI TẠO TRỌNG TÂM 38 h HÌNH 4: CẬP NHẬT VỊ TRÍ TRỌNG TÂM 39 in HÌNH 5: LẶP LẠI BƯỚC 3_ CẬP NHẬT TRỌNG TÂM .39 cK HÌNH 6: KẾT QUẢ SAU KHI PHÂN CỤM 40 HÌNH 1: SƠ ĐỒ TỔ CHỨC 42 HÌNH 2: SƠ ĐỒ THỂ HIỆN TỈ LỆ CÁC PHÒNG 43 họ HÌNH 3: GIAO DIỆN WEKA 48 HÌNH 4: MÔI TRƯỜNG LÀM VIỆC CỦA EXPLOER 49 Đ ại HÌNH 5: THẺ ASSOCIATE 50 HÌNH 6: HỘP THOẠI CÁC THAM SỐ CỦA THUẬT TOÁN APRIORI 51 HÌNH 7: HỘP THOẠI CÁC THUỘC TÍNH CỦA THUẬT TỐN K-MEANS 53 ng HÌNH 8: HỘP THOẠI PREPROCESS KHI MỞ FILE KHACHHANG.CSV .55 HÌNH 9: CÂY THƯ MỤC 57 ườ HÌNH 10: HỘP THOẠI ADDVALUES CỦA THUỘC TÍNH QUOCTICH 58 HÌNH 11: HỘP THOẠI THAY ĐỔI GIÁ TRỊ CỦA THUỘC TÍNH QUOCTICH .59 Tr HÌNH 12: KẾT QUẢ DỮ LIỆU SAU KHI TIỀN XỬ LÝ THUỘC TÍNH QUOCTICH 59 HÌNH 13: HỘP THOẠI NUMERICTONOMINAL CỦA THUỘC TÍNH GIOITINH 60 HÌNH 14: THUỘC TÍNH GIOITINH SAU KHI SỬ DỤNG ADDVALUES .61 HÌNH 15: SỬ DỤNG MERGETWOVALUES 62 HÌNH 16: KẾT QUẢ KHI TIỀN XỬ LÝ THUỘC TÍNH GIOITINH 62 HÌNH 17: HỘP THOAI MATHEXPRESSION CỦA THUỘC TÍNH TUOI .63 Nguyễn Thị Thia v Khóa luận tốt nghiệp GVHD: Th.S Dương Thị Hải Phương HÌNH 18: HỘP THOẠI NUMERICTONOMINAL CỦA THUỘC TÍNH TUOI 64 HÌNH 19: HỘP THOẠI ADDVALUES CỦA THUỘC TÍNH LOAIPHONG 65 HÌNH 20: HỘP THOẠI NUMERICTONOMINAL CỦA THUỘC TÍNH MUCCHITIEU/NGAY 65 HÌNH 21: HỘP THOẠI ADDVALUES CỦA THUỘC TÍNH PHUONGTHUCTT .66 uế HÌNH 22: KẾT QUẢ DỮ LIỆU SAU KHI TIỀN XỬ LÝ XONG CÁC THUỘC TÍNH 67 HÌNH 23: THAM SỐ MƠ HÌNH APRIORI 68 Tr ườ ng Đ ại họ cK in h tế H HÌNH 24: THAM SỐ MƠ HÌNH SIMPLEKMEANS .79 Nguyễn Thị Thia vi ... người sử dụng Ứng dụng KPDL lĩnh vực kinh doanh khách sạn thông qua đề tài ? ?Ứng dụng kỹ thuật khai phá liệu vào hoạt động tế H chăm sóc khách hàng khách sạn Vọng Cảnh ? ?thành phố Huế? ?? Đề tài tổng... khách hàng đến với Vọng Cảnh chưa nhiều thời gian lưu trú ngắn Xuất phát từ lý đề tài “ Ứng dụng khai phá liệu vào hoạt động chăm sóc khách hàng khách sạn Vọng Cảnh ? ?Thành Phố Huế? ?? chọn thực Nguyễn... giải pháp hỗ trợ chăm sóc khách hàng, giúp khách sạn chủ động với khách hàng nâng cao vị cạnh tranh Mục tiêu nghiên cứu Đề tài ? ?Ứng dụng khai phá liệu quản lý khách hàng khách sạn Vọng Cảnh? ??