Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 80 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
80
Dung lượng
3,09 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA LÂM HOÀNG TRÚC MAI NGHIÊN CỨU VÀ TRIỂN KHAI ỨNG DỤNG CÁC MƠ HÌNH LÝ THUYẾT TRONG DATA MINING VÀO LĨNH VỰC NHÀ HÀNG Chuyên ngành: HỆ THỐNG THÔNG TIN QUẢN LÝ Mã số: 603448 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 12 năm 2012 ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA LÂM HOÀNG TRÚC MAI NGHIÊN CỨU VÀ TRIỂN KHAI ỨNG DỤNG CÁC MƠ HÌNH LÝ THUYẾT TRONG DATA MINING VÀO LĨNH VỰC NHÀ HÀNG Chuyên ngành: HỆ THỐNG THÔNG TIN QUẢN LÝ Mã số: 603448 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 12 năm 2012 CƠNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán hướng dẫn khoa học: PGS TS Nguyễn Đức Cường Cán chấm nhận xét 1: TS Lê Thanh Vân Cán chấm nhận xét 2: TS Phạm Văn Chung Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày 24 tháng 12 năm 2012 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: (Ghi rõ họ, tên, học hàm, học vị Hội đồng chấm bảo vệ luận văn thạc sĩ) PGS TS Dương Tuấn Anh, CT TS Lê Thanh Vân, PB1 TS Phạm Văn Chung, PB2 TS Nguyễn Đức Cương, UY TS Võ Thị Ngọc Châu, TK Xác nhận Chủ tịch Hội đồng đánh giá LV Trưởng Khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA………… ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: LÂM HOÀNG TRÚC MAI MSHV: 10320915 Ngày, tháng, năm sinh: 06/09/1987 Nơi sinh: Tiền Giang Chuyên ngành: Hệ thống thông tin quản lý Mã số: 603448 I TÊN ĐỀ TÀI: Nghiên cứu triển khai ứng dụng mơ hình lý thuyết Data Mining vào lĩnh vực nhà hàng II NHIỆM VỤ VÀ NỘI DUNG: Xây dựng mơ hình kho liệu từ sở liệu thu thập để phục vụ việc khai phá liệu cho toán Dựa việc khảo sát hoạt động kinh doanh liệu nhà hàng để đưa vấn đề hỗ trợ trình kinh doanh hỗ trợ nhà quản lý định, từ nghiên cứu ứng dụng mơ hình lý thuyết khai phá liệu để áp dụng phù hợp vào toán đưa Triển khai ứng dụng cài đặt mơ hình nghiên cứu, đồng thời công cụ giúp nhà quản lý dễ dàng thao tác để thống kê, phân tích liệu hỗ trợ định phục vụ cho hoạt động kinh doanh cụ thể III NGÀY GIAO NHIỆM VỤ : 02/07/2012 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 30/11/2012 V CÁN BỘ HƯỚNG DẪN: PGS TS Nguyễn Đức Cường Tp HCM, ngày 24 tháng 12 năm 2012 CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN TRƯỞNG KHOA (Họ tên chữ ký) ĐÀO TẠO (Họ tên chữ ký) (Họ tên chữ ký) LỜI CÁM ƠN Để hồn thành khóa học luận văn tốt nghiệp này, tơi nhận giúp đỡ nhiệt tình từ nhiều phía: Thầy cơ, bạn bè, gia đình quan công tác Xin gửi lời cảm ơn chân thành đến người giúp đỡ tơi suốt thời gian qua Trước tiên, xin gửi lời cảm ơn đến tồn thể Thầy truyền đạt kiến thức cho tơi q trình học tập trường Đặc biệt, xin gửi lời cảm ơn chân thành sâu sắc đến Thầy hướng dẫn luận văn Nguyễn Đức Cường, thầy tận tình hướng dẫn, hỗ trợ q trình nghiên cứu hồn chỉnh luận văn Bên cạnh đó, tơi xin cảm ơn lãnh đạo anh chị quan công tác tạo điều kiện công việc để tơi hồn thành luận văn Cuối cùng, chân thành cảm ơn bạn bè, người thân gia đình bên cạnh động viên, thơng cảm chia sẻ, động lực để vượt qua lúc khó khăn nhất, giúp cho tơi vững tin tập trung vào công việc học tập Tác giả Lâm Hồng Trúc Mai TĨM TẮT Mục tiêu luận văn nghiên cứu ứng dụng mơ hình lý thuyết lĩnh vực Data warehouse Data mining thiết kế lược đồ data mart, thuật toán khai phá luật kết hợp, phương pháp hồi quy tuyến tính, lý thuyết tập phổ biến,… để xây dựng mơ hình data mart từ sở liệu thu thập được, phục vụ cho trình khai phá liệu áp dụng cho vấn đề đặt trình hoạt động nhà hàng để hỗ trợ nhà quản lý định Ngoài ra, đề tài xây dựng chương trình dựa mơ hình nghiên cứu giúp người quản trị doanh nghiệp người khơng chun lĩnh vực máy tính, đặc biệt lĩnh vực phân tích, xử lý khai thác liệu sử dụng để hỗ trợ định ABSTRACT This Thesis focuses on researching and applying some theory models in the field of Data warehousing and Data mining : Designing datamart diagram technique, Apriori algorithm for discovering association rules, Linear regression method, … Our objectives are building a Data warehouse model for storing data of a restaurant (sale orders, food, …) and writing some data mining programs working as a small Decision support system for restaurant manager MỤC LỤC DANH MỤC HÌNH ẢNH i DANH MỤC BẢNG BIỂU iii CHƯƠNG TỔNG QUAN VỀ ĐỀ TÀI 1.1 Hình thành vấn đề 1.1.1 Thực trạng nghiên cứu ứng dụng kỹ thuật phát tri thức khai phá liệu (KDD – Knowledge Discovery and Data Mining) 1.1.2 Tình hình quản trị doanh nghiệp 1.1.3 Lý chọn đề tài 1.2 Phạm vi nghiên cứu 1.2.1 Đối tượng nghiên cứu 1.2.2 Không gian thời gian thực 1.3 Quy trình phương pháp nghiên cứu 1.3.1 Quy trình nghiên cứu 1.3.2 Phương pháp nghiên cứu 1.4 Mục tiêu nghiên cứu 1.5 Ý nghĩa đề tài 1.6 Cấu trúc đề tài CHƯƠNG CƠ SỞ LÝ THUYẾT 2.1 Kỹ thuật phát tri thức khai phá liệu (KDD) 2.1.1 Khái niệm phương pháp KDD 2.1.2 Mơ hình tốn KDD 2.2 Kho liệu (Data Warehouse) 2.2.1 Khái niệm 2.2.2 Cấu trúc kho liệu 2.3 Hệ thống Business Intelligence (BI) 11 2.3.1 Khái niệm 11 2.3.2 Kiến trúc BI 11 2.4 Phương pháp khai phá luật kết hợp dựa thuật toán Apriori 12 2.4.1 Một số khái niệm 12 2.4.2 Thuật toán tổng quát xác định luật kết hợp 13 2.4.3 Thuật toán Apriori 14 2.5 Những cơng trình liên quan 24 CHƯƠNG PHÂN TÍCH, TRIỂN KHAI VÀ ĐÁNH GIÁ 25 3.1 Mô tả sở liệu (CSDL) 25 3.2 Quy trình xử lý liệu tạo data mart 28 3.2.1 Xử lý liệu 30 3.2.2 Tạo data mart 31 3.3 Giải vấn đề đặt ra: 35 3.3.1 Vấn đề 1: 35 3.3.1.1 Đặt vấn đề: 35 3.3.1.2 Giải vấn đề: 35 3.3.1.3 Thử nghiệm đánh giá: 48 3.3.2 Vấn đề 2: 53 3.3.2.1 Đặt vấn đề: 53 3.3.2.2 Giải vấn đề: 53 3.3.2.3 Thử nghiệm đánh giá 56 3.3.3 Vấn đề 3: 60 3.3.3.1 Đặt vấn đề 60 3.3.3.2 Giải vấn đề 60 3.3.3.3 Thử nghiệm đánh giá 62 CHƯƠNG KẾT LUẬN VÀ KIẾN NGHỊ 64 4.1 Kết luận 64 4.2 Kiến nghị: 64 TÀI LIỆU THAM KHẢO 66 LÝ LỊCH TRÍCH NGANG 68 - i - DANH MỤC HÌNH ẢNH Hình 1.1 Các thành phần hệ thống BI đơn giản Hình 2.1 Mơ hình tốn KDD Hình 2.2 Cấu trúc kho liệu Hình 2.3 Sơ đồ data mart sở hệ thống OLAP [5] 10 Hình 2.4 Lược đồ data mart dạng hình [5] 11 Hình 2.5 Kiến trúc BI 12 Hình 3.1 Thiết kế luận lý CSDL nguồn 25 Hình 3.2 Thiết kế luận lý data mart ban đầu 29 Hình 3.3 Thiết kế luận lý CSDL rút gọn 30 Hình 3.4 Phân loại ăn CSDL nguồn 31 Hình 3.5 Danh sách ăn sau phân loại lại (bảng Food) 32 Hình 3.6 Danh sách nguyên vật liệu (bảng Material) 33 Hình 3.7 Danh sách cách chế biến (bảng CCB) 33 Hình 3.8 Danh sách cách chế biến cụ thể 34 Hình 3.9 Mơ hình data mart hồn chỉnh 35 Hình 3.10 Danh sách 15 loại ăn mua nhiều 36 Hình 3.11 Bảng thống kê 15 loại ăn mua hay khơng hóa đơn 37 Hình 3.12 Cửa sổ New Project công cụ BI 37 Hình 3.13 Cửa sổ Data Source Wizard Project 38 Hình 3.14 Chọn Database cho mơ hình Mining 38 Hình 3.15 Cửa sổ “Select Tables and Views” phần tạo Data Sources Views 39 Hình 3.16 Cửa sổ “Specify the Training Data” 40 Hình 3.17 Cửa sổ chạy mơ hình 40 Hình 3.18 Cửa sổ “Process Mining Structure” 41 Hình 3.19 Cửa sổ kết sau Mining (thẻ Rules) 41 Hình 3.20 Cửa sổ kết sau Mining (thẻ Itemsets) 42 Hình 3.21 Các ngưỡng minimum probability importance thẻ Rules 44 - 54 Giả sử có bảng số liệu n dịng X Y … … với X, Y hai thuộc tính cần khảo sát mức độ phụ thuộc tuyến tính, đó, Y gọi phụ thuộc tuyến tính vào X ta xây dựng mơ hình Y = a.X + b, với a, b hệ số cần ước lượng dựa vào bảng số liệu biết Lý thuyết phương pháp OLS cho ta cơng thức tìm a, b, cách thức đánh giá độ tốt mơ hình : n a X i X i 1 Y i n X i X Y , i 1 b Y aX , n ESS a X i X i 1 n RSS e2i i 1 , n Y aX i i b , i 1 n Y i TSS = ESS + RSS = R2 i 1 Y , ESS TSS Trong đó: - Xi Yi giá trị số liệu đại lượng X Y giá trị trung bình đại lượng X Y n số dòng liệu số liệu X,Y Khi R gần 1, ta kết luận Y phụ thuộc tuyến tính nhiều vào X, nghĩa mơ hình xây dựng tốt, ngược lại với R gần Các bước giải vấn đề sau: - Bước 1: viết câu truy vấn với ba thông tin đầu vào mã ăn, ngày bắt đầu ngày kết thúc tính hệ số tương quan Dữ liệu có số hóa đơn lập - 55 từ 04/06/2009 đến 07/12/2010 Đó giá trị mặc định, đây, đề tài cho nhà quản lý chọn khoảng thời gian muốn khai phá mặc định chu kỳ tính xu hướng năm thời gian liệu có tạo mơ hình khơng tốt việc kinh doanh nhà hàng tăng giảm tùy theo mùa theo tháng Vì vậy, ứng dụng cho phép nhà quản lý chọn khoảng thời gian muốn theo dõi Kết trả câu truy vấn bảng có cột: ngày số lần gọi ăn SELECT TOP (100) PERCENT dbo.Receipt.IssueDate, COUNT(dbo.DetailReceipt1.ReceiptDetailID) AS Expr1 FROM dbo.DetailReceipt1 INNER JOIN dbo.Receipt ON dbo.DetailReceipt1.ReceiptID = dbo.Receipt.ReceiptID WHERE (dbo.DetailReceipt1.FoodID = @X) GROUP BY dbo.Receipt.IssueDate HAVING (dbo.Receipt.IssueDate > @Y) AND (dbo.Receipt.IssueDate < @Z) ORDER BY dbo.Receipt.IssueDate - Bước 2: tạo mảng: mảng lưu giá trị số tăng dần thay cho mảng ngày, mảng lưu số lần gọi ăn ngày tương ứng - Bước 3: lưu mảng liệu vào cột chương trình Microsoft Excel, vẽ đồ thị cho liệu - Bước 4: tính hệ số tương quan số liệu - Bước 5: viết giải thuật tính hệ số tương quan tất ăn Kết trả ứng dụng top 10 ăn có xu hướng tăng dần top 10 ăn có xu hướng giảm dần Cũng tương tự vấn đề 1, đề tài triển khai ứng dụng trực quan để hỗ trợ nhà quản lý vấn đề Ứng dụng vấn đề sau thực có giao diện sau: - 56 - Hình 3.27 Giao diện ứng dụng vấn đề 3.3.2.3 Thử nghiệm đánh giá Hình 3.28 Thử nghiệm ứng dụng vấn đề - 57 Ứng dụng có chức sau: - Chức “Tính HSTQ tất ăn”: trả hệ số tương quan tất ăn, cột Xu hướng cho biết ăn có xu hướng tăng hay giảm Ứng dụng đề nghị top 10 ăn có đường hồi quy đồng biến 10 ăn có đường hồi quy nghịch biến (với hệ số tương quan gần 1), tương ứng 10 ăn có xu hướng tăng 10 ăn có xu hướng giảm - Chức “lập mơ hình”: muốn xem liệu biểu đồ cụ thể ăn người dùng chọn chức Chức tính hệ số tương quan ăn chọn (có thể nhập mã số ăn Text-box “Hoặc nhập mã ăn”) khoảng thời gian tương ứng hai mục “Từ” “Đến” Kết xuất giá trị hệ số tương quan biểu đồ vẽ số liệu với đường hồi quy tuyến tính lưu file excel Trong trình chạy thử nghiệm số liệu vài ăn với khoảng thời gian mặc định chương trình (thời gian tồn liệu) thấy biểu đồ có tượng điểm giá trị vào tháng cuối số liệu nằm mốc (số lần gọi 0) Hình 3.29 File excel kết xuất số liệu biểu đồ mã 821 khoảng thời gian mặc định - 58 Qua trình kiểm tra lại liệu thấy liệu thực có hóa đơn lập đến ngày cuối 07/12/2010 khoảng thời gian từ đến tháng 12/2010 có hóa đơn nên làm số liệu khoảng thời gian đa phần 0, điều làm ảnh hưởng đến hệ số tương quan đường hồi quy tuyến tính tác giả lọc bỏ liệu khoảng thời gian để liệu chạy xác Do thời gian mặc định chương trình từ 04/06/2009 đến 05/08/2010 Ta chạy mơ hình lại với liệu Đề tài chạy thử nghiệm với ăn có mã 821 – bánh chè nướng góc xưa – ăn có xu hướng giảm nhiều kết chương trình với thời gian mặc định Hình 3.30 File excel kết xuất số liệu biểu đồ mã ăn 821 Trong file liệu, cột C cho biết thứ tự ngày khoảng thời gian chọn để chạy mơ hình, cột A dãy số định lượng hóa chuỗi ngày để chạy mơ hình, cột B số lần gọi mã ăn ngày tương ứng Trong biểu đồ, trục hoành thể số tương ứng với giá trị ngày (cột A) Trục tung thể giá trị số lần gọi ăn ngày (cột B) Bộ số liệu - 59 cho thấy ăn có xu hướng khách hàng gọi giảm dần khoảng thời gian từ 04/06/2009 đến 05/08/2010 (đường hồi quy có hệ số góc âm) Tiếp tục, đề tài lập mơ hình với ăn có mã 679 – giá hẹ xào/hấp huyết – ăn có xu hướng tăng cao kết chương trình với khoảng thời gian từ 25/10/2009 đến 05/08/2010 Hình 3.31 File excel kết xuất số liệu biểu đồ mã ăn 679 Cuối cùng, kết chương trình cho nhà quản lý biết 10 ăn có xu hướng tăng 10 ăn có xu hướng giảm Lúc người quản lý dùng kết để thực ý nghĩa trình bày mục đặt vấn đề Hình 3.32 Kết ứng dụng vấn đề - 60 3.3.3 Vấn đề 3: 3.3.3.1 Đặt vấn đề Đối với nhà hàng nay, khái niệm set menu khơng cịn Vậy việc tạo set menu để đáp ứng nhu cầu thị hiếu khách hàng mang lại doanh thu tốt cho nhà hàng vấn đề cần giải nhà quản lý Có thể nói nhà quản lý với kinh nghiệm biết cần kết hợp với với 1000 ăn việc lựa chọn set menu việc đơn giản định chủ quan nhà quản lý Nếu có cơng cụ đề xuất tập ăn tạo nên set menu mang lại hiệu cao dựa phân tích liệu kinh doanh thời gian qua nhà hàng giúp cho nhà quản lý định nhanh chóng, dễ dàng có sở 3.3.3.2 Giải vấn đề Giả sử set menu có món: khai vị, cuối - Bước 1: phân nhóm ăn thành loại trên.Trong bảng Food chèn thêm cột phân loại (PLM) Hình 3.33 Bảng Food có thêm cột phân loại (PLM) - 61 - Bước 2: thiết kế giao diện cho ứng dụng sau: Hình 3.34 Giao diện ứng dụng vấn đề Bên trái cửa sổ có ba danh sách liệt kê ăn ba nhóm xếp theo thứ tự từ cao xuống thấp theo tiêu chí số lần gọi tất hóa đơn Do số ăn nhóm lớn nên chương trình cho phép người dùng chọn số ăn từ nhóm với tiêu chí lấy ăn có số lần gọi nhiều Người dùng nhập giá trị vào ba textbox kế bên nhóm, chương trình lấy số ăn danh sách tương ứng với giá trị nhập ô textbox chuyển vào ba nhóm danh sách bên phải Hoặc nhà quản lý chọn ăn tùy thích - Bước 3: tạo ba mảng để lưu ba danh sách bên phải Gọi N số trường hợp set menu có món: = × × Trong đó: k1, k2, k3 số ăn chọn để khảo sát nhóm khai vị (nhóm 1), nhóm (nhóm 2) nhóm cuối (nhóm 3) - 62 - Bước 4: viết giải thuật để tính độ phổ biến trường hợp tập N Mỗi trường hợp xét điều kiện thoả: khơng có ngun vật liệu khơng cách chế biến Kết trả ứng dụng set menu có độ phổ biến cao 3.3.3.3 Thử nghiệm đánh giá Chạy ứng dụng vấn đề 3: chọn nhóm 1, 10 nhóm nhóm Chọn nút “Tìm tập phổ biến”, chương trình xuất liệu file Excel hình dưới: Hình 3.35 File excel lưu tập phổ biến chương trình - 63 Trong liệu, cột A, B, C mã ăn; cột D số hóa đơn có gọi ăn này; cột E cho biết độ phổ biến Sau liệt kê tất trường hợp tập phổ biến, chương trình xuất kết sau: Hình 3.36 Kết ứng dụng vấn đề Ta lấy kết độ phổ biến set menu để đánh giá độ phổ biến có ý nghĩa hay khơng? Set menu có độ phổ biến 0.3726% Trong xét vấn đề 1, độ phổ biến trung bình cặp X,Y 146 loại ăn 0.00472% ta lại xét ăn có đến 719 ăn, số ăn gấp lần số tính chia độ phổ biến thấp gấp lần Ở đây, set menu có nhân độ phổ biến trung bình lên lần khơng đáng kể độ phổ biến trung bình q nhỏ Do đó, với độ phổ biến 0.3726% set menu có độ phổ biến cao Dựa kết hiển thị tập luật khác file excel nhà quản lý có gợi ý để đưa chương trình khuyến với set menu hợp lý Đây chương quan trọng luận văn, nghiên cứu ứng dụng kỹ thuật khai phá liệu để hỗ trợ cho người định Thơng qua tốn, luận văn đưa mơ hình ứng dụng có ý nghĩa từ việc khai phá liệu ứng dụng phần hệ hỗ trợ định Chương cuối cùng, luận văn tổng kết lại vấn đề làm chưa làm được, đồng thời đưa hướng phát triển luận văn - 64 - CHƯƠNG KẾT LUẬN VÀ KIẾN NGHỊ 4.1 Kết luận Luận văn sử dụng ba công cụ: Microsoft Visual Studio – dùng để lập trình ứng dụng tạo nên chương trình hỗ trợ cho nhà quản lý, SQL Server Management Studio áp dụng để tạo data mart cho toán SQL Server Business Intelligence Development Studio Microsoft SQL Server 2008 để khai phá liệu lĩnh vực nhà hàng ứng dụng cho hệ hỗ trợ định để giúp nhà quản lý đưa chiến lược cho doanh nghiệp Từ đó, cho thấy vai trị liệu hệ thống thơng tin quản lý tầm quan trọng việc khai phá liệu, vai trò việc ứng dụng mơ hình lý thuyết kỹ thuật khai phá liệu vào hoạt động kinh doanh, cụ thể vấn đề làm là: - Xây dựng mơ hình data mart từ CSDL thu thập để phục vụ việc khai phá liệu cho toán - Khảo sát mối liên hệ ăn để nắm quy luật gọi khách hàng từ tạo combo ăn - Khai thác liệu tìm ăn có xu hướng tăng giảm theo thời gian để tìm nguyên xu hướng đồng thời có chiến lược phù hợp trình bày mục 3.3.2 - Ứng dụng mơ hình để tìm set menu phổ biến, phù hợp với hoạt động kinh doanh nhà hàng - Nghiên cứu mơ hình lý thuyết lược đồ data mart, thuật toán khai phá luật kết hợp dựa thuật toán Apriori, phương pháp hồi quy tuyến tính, lý thuyết tập phổ biến,…và áp dụng thành cơng mơ hình để tạo nên ứng dụng hỗ trợ nhà quản lý 4.2 Kiến nghị: Bên cạnh nội dung chủ chốt nhấn mạnh phân tích kỹ lưỡng, số nội dung cịn lại đề tài cịn chưa hồn thiện như: - 65 - Trong ứng dụng vấn đề 1, đề tài cài đặt thuật tốn Apriori Cịn nhiều kỹ thuật khai phá khác, có thêm thời gian hướng phát triển thêm đề tài nghiên cứu cài đặt thuật toán khai phá luật kết hợp dựa định Bên cạnh đó, ngồi việc chạy mơ hình phân loại ăn theo tiêu chí ngun vật liệu, đề tài dùng ứng dụng để thử nghiệm tiêu chí phân loại cách chế biến như: nướng, xào, hấp, chiên,…Có thể tìm dạng luật có ý nghĩa khác - Trong việc khai phá liệu để tìm set menu vấn đề 3, đề tài minh họa set menu có Việc phân chia ăn thành nhóm trước chạy mơ hình tốn thời gian muốn chạy mơ hình set menu món: khai vị, cuối, phải phân chia nhóm Nếu chạy mơ hình món, ta có luật có ý nghĩa Bên cạnh đó, phát triển ứng dụng cho phép nhà quản lý tự phân chia nhóm ăn Ngồi ra, cịn nhiều hướng phát triển để hồn thiện thêm mở hướng nghiên cứu ứng dụng lý thuyết logic mờ (fuzzy logic), phương khai phá mang tính heuristic mạng neural nhân tạo, thuật giải di truyền,… Các vấn đề nghiên cứu phát triển hoàn thiện góp phần bổ sung cung cấp thêm lựa chọn cho việc xác định yếu tố cấu thành mơ hình ứng dụng đề tài - 66 - TÀI LIỆU THAM KHẢO [1] Trần Đại Thắng “Vì nhà quản trị cần BI?” Internet http://lobby.vn/forums/showthread.php?p=4674, Aug.10, 2011 [2] Nguyễn Văn Chức “Business Intelligence (BI)” Internet: http://bis.net.vn/forums/p/121/242.aspx, Mar 10, 2010 [3] Nguyễn Duy Nhất, “Nghiên cứu mơ hình khai phá tri thức từ sở liệu quan hệ”, nghiên cứu khoa học, 2011 [4] Nguyễn Trần Minh Khuê, “Nhà kho liệu”, CH0401022 [5] F Ravat, R Tournier, “Decision Support Systems and Data Warehouses” [6] C.Vercellis Business Intelligence: Data Mining and Optimization for Decision Making United Kingdom: John Wiley & Sons, Ltd, 2009, pp [7] Wen-Yu Chiang (2010, August 06) To mine association rules of customer values via a data mining procedure with improved model: An empirical case stud [Online] Available: http://www.sciencedirect.com/science/article/pii/S0957417410007256 [8] Xiaobing Liu et al “An improved association rules mining method”, International Journal Volume 39 Issue 1, January 2012 [9] Hanhoon Kang et al (2011,December 03) “Senti-lexicon and improved Naïve Bayes algorithms for sentiment analysis of restaurant reviews” [Online] Available: http://www.sciencedirect.com/science/article/pii/S0957417411016538 [10] M Ester et al, “Incremental Clustering for Mining in a Data Warehousing Environment,” Proceedings of the 24th VLDB Conference New York, USA, 1998 [11] A Kusiak et al, “Rough Set Theory: A Data Mining Tool for Semiconductor Manufacturing,” IEEE transactions on electronics packaging manufacturing, vol 24, no 1, january 2001 [12] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006 [13] David L Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag, 2008 - 67 [14] Graham J Williams, Simeon J Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag, 2006 [15] Ping-Ho Ting, Steve Pan, and Shuo-Shiung Chou, “Finding Ideal Menu ItemsAssortments: An EmpiricalApplication of Market Basket Analysis”, 2010 [16] Lon-Mu Liu, William J Lattyak, “Data Mining On Time Seriesan Illustration Using Fast-Food Restaurant Franchise Data”, 2001 - 68 - LÝ LỊCH TRÍCH NGANG Họ tên: LÂM HỒNG TRÚC MAI Ngày, tháng, năm sinh: 06/09/1987 Nơi sinh: Tiền Giang Địa liên lạc: TK 26/6 Nguyễn Cảnh Chân, P.Cầu Kho, Q.1, Tp.Hồ Chí Minh Q TRÌNH ĐÀO TẠO - Từ năm 2005 đến năm 2008: Học tốt nghiệp trường Đại học Kinh tế Luật TP.Hồ Chí Minh, ngành Hệ thống thông tin quản lý - Từ năm 2010 đến nay: Học chươg trình đào tạo cao học trường Đại học Bách Khoa TP Hồ Chí Minh, ngành Hệ thống thơng tin quản lý Q TRÌNH CƠNG TÁC - Từ 2009 đến nay: làm việc Khoa Cơng nghệ thơng tin, trường Đại học Tài Chính – Marketing, chức vụ Giảng viên ... tài “NGHIÊN CỨU VÀ TRIỂN KHAI ỨNG DỤNG CÁC MƠ HÌNH LÝ THUYẾT TRONG DATA MINING VÀO LĨNH VỰC NHÀ HÀNG” với mong muốn đóng góp vào lĩnh vực KDD thành cơng việc triển khai ứng dụng kết nghiên cứu. .. LÂM HOÀNG TRÚC MAI NGHIÊN CỨU VÀ TRIỂN KHAI ỨNG DỤNG CÁC MƠ HÌNH LÝ THUYẾT TRONG DATA MINING VÀO LĨNH VỰC NHÀ HÀNG Chuyên ngành: HỆ THỐNG THÔNG TIN QUẢN LÝ Mã số: 603448 LUẬN VĂN THẠC... việc nghiên cứu ứng dụng mơ hình lý thuyết cho tốn cụ thể doanh nghiệp vấn đề cần thiết Trong trình khảo sát, tác giả nhận thấy chưa có nhiều nghiên cứu ứng dụng data mining vào lĩnh vực nhà hàng