Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 149 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
149
Dung lượng
2,28 MB
Nội dung
LỜI CẢM ƠN LUẬN VĂN THẠC SĨ LỜI CẢM ƠN Trước hết, xin chân thành gửi lời tri ân sâu sắc ñến Tiến sĩ Nguyễn ðức Cường Thầy ñã giới thiệu đề tài hướng dẫn tơi giai ñoạn làm ñề cương giai ñoạn luận văn Thầy có hướng dẫn nghiên cứu khoa học ý kiến đóng góp q báu Những lời dạy ñộng viên Thầy hành trang ghi nhớ tơi bước đường học vấn nghiệp sau Tôi xin trân trọng cảm ơn giảng viên phản biện Tiến Sĩ Lê Văn Dực Tiến Sĩ Quản Thành Thơ Thầy hội ñồng ñã dành nhiều thời gian ñể chỉnh sửa cho tơi nhiều ý kiến bổ ích cách trình bày phương pháp thực luận văn Tơi xin bày tỏ lịng cảm ơn sâu sắc đến tất thầy khoa Cơng Nghệ Thơng Tin khoa khác giảng dạy cho suốt thời gian học tập Cao Học trường, truyền đạt cho tơi kiến thức q báu khơng phục vụ tốt cho đề tài mà cịn cho cơng việc sau Tôi xin trân trọng gửi lời cảm ơn đến anh chị cơng tác phịng mua hàng, phịng quản lý thơng tin Cơng ty Metro Cash & Carry Việt Nam ñã dành thời gian hỗ trợ đóng góp ý kiến thực tiễn cho đề tài Tơi xin chân thành cảm ơn Phịng ðào Tạo Sau ðại học thiết lập chương trình Thạc sĩ Khoa học máy tính có giá trị mà tơi danh dự theo học hai năm qua Tơi chân thành cảm ơn gia đình, tất người thân bạn bè ln hết lịng ủng hộ, động viên giúp đỡ tơi suốt thời gian học tập làm việc Cuối cùng, tơi xin gửi đến tất người lời chúc sức khỏe, hạnh phúc thành công TP.HCM, ngày 07 tháng 09 năm 2007 Học viên Cao Tấn Thiết GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết i TÓM TẮT LUẬN VĂN THẠC SĨ TÓM TẮT Khám phá tri thức sở liệu (Knowledge Discovery in Databases) ñang xu hướng phát triển mạnh cơng nghệ thơng tin giới Nó có khả ứng dụng vào nhiều lớp toán thực tế khác Bước quan trọng trình khai phá liệu, giúp người sử dụng thu ñược tri thức hữu ích từ sở liệu nguồn liệu khổng lồ khác Rất nhiều doanh nghiệp tổ chức giới ñã ứng dụng kĩ thuật khai phá liệu vào hoạt động sản xuất kinh doanh thu lợi ích to lớn Trong lĩnh vực kinh doanh siêu thị, khai phá liệu tỏ đặc biệt hiệu siêu thị ngành có số lượng sản phẩm ña dạng, số lượng khách hàng lớn có lượng liệu cần lưu trữ khổng lồ Bên cạnh đó, thị trường siêu thị ln ln biến động đầy cạnh tranh Chính vậy, việc nghiên cứu áp dụng kĩ thuật khai phá liệu vào hoạt ñộng sản xuất kinh doanh siêu thị cần thiết ðề tài giới thiệu cách tổng quan kĩ thuật khai phá liệu, mơ hình, kiến trúc, phạm vi ứng dụng, lợi ích đề xuất phương pháp giải thuật để giải tốn dự báo doanh số bán hàng tập đồn siêu thị Metro Cash & Carry Việt Nam ñể hỗ trợ việc ñặt hàng Nghiên cứu sử dụng phương pháp hồi quy áp dụng lên mơ hình tốn học phổ biến, q trình tìm hệ số ước lượng ñược giải giải thuật Nelder-Mead Giải thuật Nelder-Mead giải thuật tìm kiếm có hướng, sử dụng để tìm giá trị nhỏ sai số dự báo hàm số tốn học giá trị nhỏ ñạt ñến ñộ hội tụ Kết ứng dụng ñề tài hỗ trợ nhà quản lý mua bán hàng tiếp thị việc ñịnh ñặt hàng ñưa chiến lược kinh doanh hợp lý, nhằm mục đích ñem lại lợi nhuận tối ña cho siêu thị GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết ii LUẬN VĂN THẠC SĨ MỤC LỤC MỤC LỤC LỜI CẢM ƠN .i TÓM TẮT ii MỤC LỤC iii DANH MỤC HÌNH viii DANH MỤC BẢNG x DANH MỤC VIẾT TẮT xi PHÁT BIỂU VẤN ðỀ PHẦN 1.1 Mở ñầu 1.2 ðề tài nghiên cứu 1.2.1 Sự cần thiết ñề tài .2 1.2.2 ðặt vấn ñề 1.2.3 Giải vấn ñề ðối tượng phạm vi nghiên cứu 1.3 1.3.1 ðối tượng nghiên cứu .5 1.3.2 Phạm vi nghiên cứu ñề tài 1.3.3 Ý nghĩa thực tiễn ñề tài 1.3.3.1 Về mặt học thuật 1.3.3.2 Về mặt ứng dụng 1.4 Nội dung trình bày PHẦN 2.1 CƠ SỞ LÝ THUYẾT Cơ sở lý thuyết khai phá liệu 2.1.1 Giới thiệu khai phá liệu .9 2.1.2 Các q trình mơ hình khai phá liệu 10 2.1.2.1 Tìm hiểu nghiệp vụ liệu 11 GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết iii LUẬN VĂN THẠC SĨ MỤC LỤC 2.1.2.2 Chuẩn bị liệu 12 2.1.2.3 Mơ hình hố liệu 13 2.1.2.4 Hậu xử lý ñánh giá 14 2.1.2.5 Triển khai 14 2.1.3 Dữ liệu nhập 14 2.1.4 Các nhóm phương pháp khai phá liệu 15 2.1.5 Dữ liệu xuất 15 2.1.6 ðánh giá hệ thống khai phá liệu 16 2.2 Các tiêu chuẩn ứng dụng khai phá liệu 16 2.2.1 Các tiêu chuẩn .16 2.2.2 Các ứng dụng 18 2.3 Các phương pháp giải vấn ñề dự báo 19 2.3.1 Các phương pháp hồi quy tuyến tính 19 2.3.1.1 Giới thiệu 19 2.3.1.2 Phương pháp hồi quy tuyến tính đơn 20 2.3.1.3 Phương pháp hồi quy tuyến tính đa biến 23 2.3.2 Phương pháp hồi quy phi tuyến 25 2.3.2.1 Giới thiệu 25 2.3.2.2 Hệ số tương quan 27 2.3.2.3 Khái niệm làm trơn 28 2.3.2.4 ðường khuynh hướng 29 2.3.3 Các dạng mơ hình tốn học 31 2.3.3.1 Hàm tuyến tính với hệ số góc 31 2.3.3.2 Hàm ða thức 31 2.3.3.3 Hàm phân bố Gauss (Gaussian Distribution Function) 33 GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết iv LUẬN VĂN THẠC SĨ 2.3.3.4 Hàm phân phối log-Normal hai tham số 34 2.3.3.5 Hàm phân phối Log-normal ba tham số 34 2.3.3.6 Hàm phân bố logistic 35 2.3.3.7 Hàm phân phối Lorentzian 35 2.3.3.8 Hàm phân phối Poisson 36 2.3.3.9 Hàm phân phối Gumbel có hai tham số 36 2.3.3.10 Hàm phân phối Fréchet 38 2.3.3.11 Hàm phân phối Weibull 38 2.3.3.12 Hàm phân phối mũ 40 2.3.3.13 Hàm ngưỡng Sigmoid 40 2.3.3.14 ðánh giá 41 2.3.4 2.4 MỤC LỤC Hồi quy chuỗi thời gian 41 2.3.4.1 Giới thiệu 41 2.3.4.2 Phân tích xu hướng biến ñộng chuỗi thời gian 42 2.3.4.3 Phân tích tính thời vụ chuỗi thời gian 44 Giải thuật Nelder-Mead 46 2.4.1 Giới thiệu 46 2.4.2 Giải thuật Nelder-Mead 46 2.4.3 Một bước lặp giải thuật Nelder–Mead 47 2.5 Thư viện WEKA 50 2.5.1 Giới thiệu 50 2.5.2 Phát triển ứng dụng dựa Weka 54 2.5.3 Phần mềm Weka 55 2.5.3.1 Explorer 56 2.5.3.2 KnowledgeFlow 57 GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết v LUẬN VĂN THẠC SĨ MỤC LỤC 2.5.3.3 Experimenter 57 2.5.3.4 Simple CLI 58 PHẦN 3.1 PHÂN TÍCH DỮ LIỆU NGHIỆP VỤ 60 Phân tích sở liệu siêu thị 60 3.1.1 Hệ thống data warehouse 61 3.1.2 Hệ thống quản lý doanh số thưởng .63 3.2 Giải toán 66 3.3 Bài toán dự báo doanh số bán sản phẩm 66 3.4 Tính tốn doanh số đặt hàng cho nhà cung cấp 67 3.5 Hỗ trợ ñịnh 67 PHẦN 4.1 THIẾT KẾ VÀ HIỆN THỰC 69 Thiết kế 69 4.1.1 Tìm hiểu nghiệp vụ hệ thống sở liệu .69 4.1.2 Trích xuất liệu 69 4.1.3 Tiền xử lý 71 4.1.4 Chọn mơ hình 71 4.1.5 Chọn mơ hình tốt 71 4.1.6 Dữ liệu ñầu vào cho bước dự báo 72 4.1.7 Kết dự báo 72 4.1.8 ðánh giá kết dự báo .72 4.2 Hiện thực 73 4.2.1 Dữ liệu ban ñầu: 73 4.2.2 Dữ liệu sản phẩm 74 4.2.3 Tạo mơ hình 75 4.2.4 Tìm mơ hình tốt 79 4.2.5 Tính giá trị dự báo 80 GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết vi LUẬN VĂN THẠC SĨ MỤC LỤC 4.3 Hiện thực hồi quy phi tuyến tính sử dụng giải thuật Nelder-Mead 80 4.4 Cơng cụ phát triển giao diện chương trình 82 4.4.1 Môi trường công cụ phát triển 82 4.4.2 Giao diện chương trình 82 4.5 Một số dạng đồ thị chương trình 86 ðÁNH GIÁ VÀ KẾT LUẬN 89 PHẦN 5.1 ðánh giá kết 89 5.1.1 Phép so sánh .90 5.1.2 Phép so sánh .95 5.1.3 Phép so sánh .96 5.1.4 So sánh trực quan 96 5.1.5 ðộ xác 98 5.2 Sử dụng giá trị dự báo ñể hỗ trợ việc ñặt hàng 98 5.2.1 Quy tắc nghiệp vụ (Business rule) 98 5.2.2 Áp dụng giá trị dự báo vào hệ thống BAS 101 5.3 Kết luận 101 5.3.1 Những kết ñạt ñược 101 5.3.2 Những hạn chế 102 5.4 Hướng phát triển 102 5.4.1 Về mặt học thuật 102 5.4.2 Về mặt ứng dụng .103 TÀI LIỆU THAM KHẢO 105 PHỤ LỤC 1: KẾT QUẢ TÍNH TỐN CỦA PHÉP SO SÁNH 107 PHỤ LỤC 2: KẾT QUẢ TÍNH TỐN CỦA PHÉP SO SÁNH 111 PHỤ LỤC 3: KẾT QUẢ TÍNH TỐN CỦA PHÉP SO SÁNH 117 PHỤ LỤC 4: ðÁNH GIÁ CỦA NHÀ QUẢN LÝ SIÊU THỊ 125 GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết vii LUẬN VĂN THẠC SĨ DANH MỤC HÌNH DANH MỤC HÌNH Hình 2.1 Mơ hình bước khai phá liệu 11 Hình 2.2 Sơ ñồ trình phương pháp CRISP-DM [15] 18 Hình 2.3 ðồ thị biểu diễn mối quan hệ năm kinh nghiệm lương 23 Hình 2.4 ðồ thị thể ñường khuynh hướng giá trị doanh số bán theo năm 30 Hình 2.5 ðường khuynh hướng thể ñến giá trị tương lai 30 Hình 2.6 Hình dạng hàm đa thức bậc 32 Hình 2.7 Hình dạng biểu diễn hàm phân bố Gauss 33 Hình 2.8 Hình dạng hàm log-normal hai tham số 34 Hình 2.9 Hình dạng hàm phân phối Log-normal ba tham số 35 Hình 2.10 Hình dạng hàm phân phối Lorentzian 36 Hình 2.11 Hình dạng hàm Poisson µ = 37 Hình 2.12 Hình dạng hàm phân phối Gumbel có hai tham số 37 Hình 2.13 Hình dạng ñồ thị hàm Frechet 38 Hình 2.14 Hình dạng đồ thị hàm số Weibull 39 Hình 2.15 Hình dạng hàm mũ hai tham số 40 Hình 2.16 ðồ thị biểu diễn xu hướng doanh số bán hàng 44 Hình 2.17 Giải thuật Nelder–Mead sau bước đối xứng mở rộng (reflection and expansion),với đơn hình ban ñầu ñược vẽ với ñường nét ñứt 49 Hình 2.18 Giải thuật Nelder-Mead sau bước rút gọn phía ngồi, rút gọn bên bước co lại 49 Hình 2.19 Giao diện trực quan cơng cụ WEKA 52 Hình 2.20 Giao diện phần mềm WEKA 55 Hình 2.21 Giao diện module Explorer weka 56 Hình 2.22 Giao diện module KnowledgeFlow weka 57 Hình 2.23 Giao diện Experimenter 58 Hình 2.24 Giao diện CLI 59 Hình 3.1 Sơ đồ sở liệu tóm lược hệ thống GMS 60 Hình 3.2 Sơ đồ chuyển liệu hệ thống 62 GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết viii LUẬN VĂN THẠC SĨ DANH MỤC HÌNH Hình 3.3 Các loại liệu từ GMS chuyển sang data warehouse 62 Hình 3.4 Mối quan hệ hợp đồng ñiều kiện 63 Hình 3.5 Sơ ñồ sở liệu quan hệ sơ lược hệ thống BAS 64 Hình 3.6 Sơ đồ phân cấp sản phẩm theo nhóm sản phẩm 65 Hình 3.7 Sơ đồ bước xử lý để giải vấn ñề 66 Hình 4.1 Sơ đồ bước thực chương trình 70 Hình 4.2 Sơ đồ liệu trình thực chương trình 70 Hình 4.3 ðịnh dạng tập tin liệu sản phẩm sau bước tiền xử lý 75 Hình 4.4 Nội dung tập tin mơ hình dạng arff 79 Hình 4.5 Giao diện chương trình 84 Hình 4.6 Các menu menu Application, dùng để chạy thao tác chương trình 84 Hình 4.7 Giao diện phần tiền xử lý chương trình (Preprocess) 85 Hình 4.8 Công cụ ArffViewer 85 Hình 4.9 Biểu diễn hàm ña thức phụ thuộc giá trị doanh số bán theo tuần 86 Hình 4.10 Biểu diễn hàm ña thức phụ thuộc giá trị doanh số bán theo tuần 87 Hình 4.11 Biểu diễn hàm ña thức phụ thuộc giá trị doanh số bán (Sales) theo tuần 87 Hình 5.1 Các tập tin mơ hình chương trình sinh ra, f1 tương ứng với hàm đa thức 90 Hình 5.2 ðồ thị biễu diễn giá trị dự báo, giá trị thực sai số 94 Hình 5.3 ðường khuynh hướng dạng ña thức ñồ thị ñiểm liệu vẽ từ Excel 97 Hình 5.4 ðồ thị biểu diễn liệu sản phẩm 81261từ chương trình 97 Hình 5.5 ðồ thị biểu diễn phần trăm chiết khấu tương ứng với giá trị doanh số mua hàng 101 GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết ix LUẬN VĂN THẠC SĨ DANH MỤC BẢNG DANH MỤC BẢNG Bảng 1-1 Tỉ lệ chiết khấu tương ứng với doanh số mua hàng nhà cung cấp Bảng 2-1: Số liệu mối quan hệ năm kinh nghiệm lương tương ứng 22 Bảng 2-2 Một số dạng chuyển thông dụng sang dạng hồi quy tuyến tính 26 Bảng 2-3 Dữ liệu thuộc tính A B 28 Bảng 2-4 Dữ liệu doanh số bán hàng 29 Bảng 2-5 Doanh số bán theo năm công ty 43 Bảng 4-1 Các dạng hàm toán học ñược sử dụng ñề tài 76 Bảng 5-1 Kết so sánh giá trị dự báo so với giá trị thực số sản phẩm thuộc nhà cung cấp 20022 91 Bảng 5-2 Dữ liệu hợp ñồng nhà cung cấp 20093 99 Bảng 5-3 Tiền thưởng tương ứng với phần trăm chiết khấu hợp ñồng 100 Bảng 5-4: Kết so sánh giá trị thực giá trị dự báo theo sản phẩm 107 Bảng 5-5: Bảng kết so sánh theo giá trị tổng sản phẩm theo nhà cung cấp 111 Bảng 5-6: Bảng so sánh theo mơ hình giá trị dự báo giá trị thực 117 GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết x LUẬN VĂN THẠC SĨ GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết PHỤ LỤC 124 LUẬN VĂN THẠC SĨ PHỤ LỤC PHỤ LỤC 4: ðÁNH GIÁ CỦA NHÀ QUẢN LÝ SIÊU THỊ Sau ñây ñánh giá nhà quản lý từ phịng Thu Mua phịng Quản lý thơng tin siêu thị Metro Cash & Carry Việt Nam, ñây siêu thị ñã cung cấp liệu thực tế cho ñề tài Các nhà quản lý thường làm việc với hệ thống quản lý ñể tạo báo cáo ngày, hàng tuần năm Trong có báo cáo dự báo doanh số bán doanh số mua hàng siêu thị Các vấn ñề họ gần gũi với ñề tài, ñề tài ñã quan tâm giải vấn đề Các kết có đề tài đóng góp hữu ích vào cơng việc họ hoạt động siêu thị GVHD: TS Nguyễn ðức Cường HVTH: Cao Tấn Thiết 125 MỤC LỤC I GIỚI THIỆU II CÁC YÊU CẦU ð Ể CHẠY CHƯƠNG TRÌNH III GIAO DIỆN CHƯƠNG TRÌNH: IV CÁC BƯỚC XỬ LÝ CHƯƠNG TRÌNH Bước 1: Tiền xử lý Bước 2: Tạo mơ hình Bước 3: Chọn mơ hình tốt Công cụ ArffViewer 11 Chuyển ñổi từ file ñịnh dạng arff sang dạng file CSV Excel: 12 Kết thúc chương trình: 13 HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH I Giới thiệu Tài liệu hướng dẫn sử dụng chương trình dự báo doanh số bán hàng nhà cung cấp từ luận văn tốt nghiệp ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU TRÊN DỮ LIỆU BÁN HÀNG ðỂ HỖ TRỢ VIỆC ðẶT HÀNG II Các u cầu để chạy chương trình Vì chương trình phát triển Java nên muốn chương trình chạy được, máy tính cần trang bị máy ảo java Có thể cài chương trình Java runtime Enviroment (jre-6u2-windows-i586-p.exe)từ đĩa CD Biên dịch chương trình: dùng phần mềm Eclipse 3.2 ( Có CD này), chạy File Weka.gui.Main.java Cấu hình máy: Windows XP, RAM 512 MB, CPU Pentium III Hướng dẫn cài đặt chương trình Vào thư mục Setup CD, thư mục gồm có hai file, mở file SalesForecast.msi ñể cài ñặt, theo hướng dẫn chương trình cài đặt, cài đặt dễ dàng, sau cài đặt xong, chạy chương trình từ biểu tượng SalesForecast Desktop IV Giao diện chương trình: Chương trình theo hình 1, gồm menu File, Application, Tools, Visualization Help Phần chương trình menu Application, có chức chương trình tiền xử lý (Preprocess), tạo mơ hình ( Create Models), chọn mơ hình tốt (Choose Best Model) Hình 1: Giao diện chương trình V Các bước xử lý chương trình Bước 1: Tiền xử lý Là bước xử lý liệu từ file csv bao gồm nhiều trường khác sang ñịnh dạng file arff bao gồm hai trường tuần (week) doanh số bán (sales value) Từ menu Application, chọn Pre-process, cửa số Pre-process mở hình Hình 2: Màn hình bước tiền xử lý Các thao tác: Open Data… : nhấn vào ñể chọn ñường dẫn thư mục chứa file liệu dạng csv Save Output…: nhấn vào ñể chọn ñường dẫn thư mục chứa file liệu xuất dạng arff Dữ liệu dùng cho bước tạo mơ hình Pre-Process: nhấn nút chương trình thực việc tạo file xuất dạng arff, trước nhấn nút phải bảo ñảm liệu ñầu vào ñã ñược chọn Ví dụ: ðường dẫn thư mục chứa file csv D:\Demo\CSV ðường dẫn thư mục chứa file liệu xuất D:\Demo\Output\Preprocess Khi nhấn nút Pre-Process liệu xuất chứa vào thư mục Preprocess hình 3, thư mục có tên mã nhà cung cấp chứa file arff file liệu sản phẩm nhà cung cấp Hình 3: Các thư mục xuất trình tiền xử lý Bước 2: Tạo mơ hình Từ menu Application, chọn Create Models, cửa sổ mở hình Hình 4: Màn hình bước tạo mơ hình Các thao tác: Open Data…: nhấn vào để chọn ñường dẫn thư mục chứa file liệu dạng arff (D:\Demo\Output\Preprocess) Choose Models: nhấn vào ñể chọn dạng mơ hình tốn học để mơ hình hóa liệu cần chạy Màn hình mở để chọn dạng mơ hình Muốn chọn mơ hình click chọn dịng bảng chứa mơ hình, muốn chọn nhiều mơ hình nhấn giữ phím Ctrl click chuột lên dịng muốn chọn tương ứng, ý chương trình cho phép chọn tạo mơ hình có vẽ đồ thị minh họa cho mơ hình hay khơng, muốn vẽ đồ thị click chọn vng cột “Draw graph?”, nhiên, số lượng ñồ thị số lượng mơ hình tạo tương ứng, số lượng lớn mơ hình chương trình tạo nhiều hình đồ thị, khó theo dõi Lúc cửa sổ bên hiển thị mơ hình mà chọn Xong đóng cửa sổ chọn mơ hình lại Save Models…: nhấn vào để chọn đường dẫn thư mục chứa file mơ hình xuất dạng arff File mơ hình chứa tham số tương ứng mơ hình Create Models: nhấn nút chương trình thực việc tạo mơ hình tương ứng sản phẩm, file xuất dạng arff, trước nhấn nút phải bảo ñảm liệu ñầu vào ñã ñược chọn khơng chương trình khơng cho kết đầu Kết hình 6 Hình 5: Chọn mơ hình tốn để tạo mơ hình Hình 6: Các thư mục chứa mơ hình kết Bước 3: Chọn mơ hình tốt Chọn Application Choose Best Model từ menu Cửa sổ chọn mơ hình tốt mở hình Các thao tác: Open Models: Mở đường dẫn thư mục chứa file mơ hình tạo bước Bước truyền file mơ hình cho chương trình chọn mơ hình tốt Choose Best Model…: click nút để chương trình chạy tìm mơ hình tốt Vì bước chọn mơ hình tốt cho chọn cho sản phẩm nhà cung cấp nên tác giả mặc định đường dẫn chứa mơ hình tốt thư mục có tên Final, thư mục nằm thư mục nhà cung cấp hình Click dấu X (close) để đóng cửa sổ Choose Best Model lại Ví dụ: hình 8, đường dẫn D:\Demo\Output\Models\20022\Final\ chứa file mơ hình tốt nhà cung cấp có mã số 20022 Hình 7: Giao diện bước chọn mơ hình tốt Hình 8: thư mục chứa mơ hình tốt Bước 4: Dự báo Bước chương trình tính tốn giá trị dự báo dựa vào mơ hình tính bước Chọn Application Forecast, sổ mở hình 9 Hình 9: Màn hình cho bước dự báo (forecast) Các thao tác: Open Models: Chọn thư mục chứa mơ hình dự báo (ví dụ: )Thư mục chứa thư mục mã nhà cung cấp Chương trình tìm mã nhà cung cấp tương ứng với tên thư mục ñể tính giá trị dự báo nhà cung cấp Save Output: Chọn đường dẫn chứa kết dự báo (Ví dụ: D:\Demo\Output\Forecast.) Run Forecasting: Chương trình chạy tính tồn kết dự báo, kết ñược lưu vào thư mục chọn (D:\Demo\Output\Forecast.) Kết dự báo ñược chứa thư mục giống cấu trúc thư mục chứa mô hình Ví dụ: Nếu thư mục chứa mơ hình D:\Demo\Output\Models\20022\ Thì thư mục kết dự báo D:\Demo\Output\Forecast\20002\ Xem hình 10 10 Hình 10: thư mục chứa mơ hình(bên trái) thư mục chứa kết dự báo(bên phải) Cơng cụ ArffViewer Vì chương trình xử lý thơng qua hầu hết dạng file arff nên chương trình cung cấp cơng cụ ArffViewer giúp người dùng xem trực tiếp file có định dạng arff Chọn Tools ArffViewer, Cửa sổ Arff-Viewer mở ra, từ cửa sổ này, mở file dạng arff cách vào File Open, chọn file cần mở, hình có dạng hình 11 11 Hình 11: Cửa sổ cơng cụ Arff-Viewer Chuyển đổi từ file ñịnh dạng arff sang dạng file CSV Excel: Vì dạng xuất kết dự báo dạng file arff nên để tiện sử dụng, chương trình hỗ trợ chức chuyển ñổi ñịnh dạng file arff sang ñịnh dạng csv phần mềm Excel ñể dễ thao tác, chương trình cho phép chuyển lúc nhiều file từ thư mục sang dạng csv Thao tác: chọn Tools Convert to CSV, hình mở hình 12 Open Arff Directory: nhập vào đường dẫn thư mục chứa file ñịnh dạng arff cần chuyển ñổi Save CSV output: Chọn ñường dẫn thư mục chứa file kết chuyển đổi có định dạng csv Convert to CSV: thực q trình chuyển đổi, đợi khoảng thời gian ngắn, chương trình thơng báo kết chuyển đổi 12 Kết thúc chương trình: Chọn File Exit, chương trình kết thúc 13 ... đề xuất phương pháp giải thuật để giải tốn dự báo doanh số bán hàng tập đồn siêu thị Metro Cash & Carry Việt Nam ñể hỗ trợ việc ñặt hàng Nghiên cứu sử dụng phương pháp hồi quy áp dụng lên mơ hình... vậy, việc nghiên cứu áp dụng kĩ thuật khai phá liệu vào hoạt ñộng sản xuất kinh doanh siêu thị cần thiết ðề tài giới thiệu cách tổng quan kĩ thuật khai phá liệu, mơ hình, kiến trúc, phạm vi ứng dụng, ... siêu thị, mà lĩnh vực kinh doanh khác, áp dụng lý thuyết, phương pháp khai phá liệu sử dụng ñề tài để phát triển thành ứng dụng hữu ích cho nhà quản lý Hơn nữa, ñây ñề tài thuộc lĩnh vực hệ hỗ